Tecnología 13news-Tecnología 02/04/2024

La escasez de datos fiables amenaza el desarrollo de la inteligencia artificial

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM)

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM). Esta situación podría obstaculizar el desarrollo de chatbots cada vez más avanzados y precisos, en un momento en que la carrera por ofrecer los mejores productos de IA se intensifica.

La importancia de los datos fiables en el entrenamiento de la IA
Los chatbots como ChatGPT de OpenAI se entrenan con grandes cantidades de información, como artículos científicos, noticias y entradas de Wikipedia. La calidad y fiabilidad de estos datos son fundamentales para que los modelos generen respuestas precisas y deseables. Sin embargo, se estima que para 2028, la demanda de datos de alta calidad superará la oferta de material de entrenamiento disponible, según Pablo Villalobos, experto en IA de la firma de investigación Epoch.

Copilot versus ChatGPT, cuáles son los desafíos para Microsoft

Desafíos en la obtención de datos adecuados
Gran parte de la información pública disponible en internet no es adecuada para el entrenamiento de la IA debido a frases incompletas y otros defectos textuales. Además, la creciente cantidad de texto generado por la propia IA podría contaminar los modelos con sinsentidos, un fenómeno conocido como "colapso del modelo".

Restricciones de acceso a contenidos
Los principales medios de comunicación, plataformas de redes sociales y otras fuentes públicas han restringido el acceso a sus contenidos para el entrenamiento de la IA, citando preocupaciones sobre derechos de autor, privacidad y compensación justa. Asimismo, las personas se muestran reacias a que sus conversaciones y mensajes privados sean utilizados para estos fines.

En busca de nuevas fuentes de datos
Ante este panorama, las compañías están explorando nuevas fuentes de datos para mejorar sus herramientas. OpenAI, por ejemplo, está considerando entrenar GPT-5, su modelo más avanzado, con transcripciones de vídeos de YouTube. También se ha planteado la creación de un mercado de datos donde los proveedores puedan cobrar por contenidos valiosos para el entrenamiento de modelos. Google, por su parte, está estudiando un enfoque similar.

El potencial de los datos sintéticos
Algunas empresas están experimentando con "datos sintéticos" generados internamente para mejorar sus modelos. Anthropic ya ha incorporado este tipo de datos en Claude, su familia de chatbots de IA, mientras que OpenAI también estaría explorando esta posibilidad.

Bitcoin restablece métricas claves mientras el precio cae: Análisis técnico

Preocupaciones sobre la calidad de los chatbots
La escasez de datos coincide con las quejas de los usuarios sobre la calidad de los chatbots de IA. Algunos han reportado problemas con GPT-4 de OpenAI para seguir instrucciones y responder consultas, mientras que Google tuvo que pausar la función de generación de imágenes por IA de su modelo Gemini debido a inexactitudes históricas.

Conclusión
A medida que las empresas buscan soluciones para seguir entrenando sus modelos de IA, algunas parecen dispuestas a limitar el tamaño de sus sistemas. Sam Altman, CEO de OpenAI, sugiere que la era de los modelos gigantes podría estar llegando a su fin, y que las mejoras vendrán por otros caminos. En este contexto, la búsqueda de datos fiables se perfila como un desafío clave para el futuro desarrollo de la inteligencia artificial.

Te puede interesar

Jensen Huang califica de "fracaso total" las restricciones estadounidenses a la exportación de chips hacia China

El director ejecutivo de Nvidia ha intensificado sus críticas hacia la política comercial tecnológica implementada por Washington, revelando una dramática reducción en la participación de mercado de la compañía en territorio chino

Sundar Pichai revela: Google evaluó seriamente la compra de Netflix

El máximo ejecutivo de Alphabet valoró como "intensas" las conversaciones internas para adquirir el gigante del streaming

La paradoja de Meta: Zuckerberg impulsa amigos virtuales en la era de la soledad digital

La visión del CEO de Meta sobre compañeros digitales generados por inteligencia artificial surge precisamente cuando miles de usuarios abandonan las plataformas que contribuyeron a incrementar el aislamiento social

Perplexity ultima una ronda de financiación de 450 millones de euros que eleva su valoración a 12.600 millones

Perplexity AI, la startup de San Francisco que desafía a Google en el sector de las búsquedas en internet con su enfoque basado en inteligencia artificial, está a punto de cerrar una importante ronda de financiación

OpenAI y Microsoft renegocian alianza clave para desbloquear financiación y preparar salida a bolsa

OpenAI y Microsoft han iniciado conversaciones estratégicas para redefinir fundamentalmente su asociación multimillonaria, con el objetivo dual de facilitar una futura oferta pública inicial (OPI)

Amazon prepara Kiro, su nueva arma secreta para revolucionar el mercado de desarrollo de software con agentes de IA

La división de servicios en la nube de Amazon está desarrollando una innovadora herramienta de programación potenciada por inteligencia artificial que podría transformar radicalmente la creación de software

OpenAI mantiene el control en su fundación sin fines de lucro mientras busca capital millonario para su expansión

La gigante de inteligencia artificial OpenAI ha anunciado que su entidad sin ánimo de lucro seguirá controlando la división con fines comerciales de la compañía, incluso después de transformarse en una sociedad de beneficio público para recaudar más fondos

Trump juega a dos bandas con las tecnológicas: defensor internacional, fiscalizador doméstico

La administración Trump está mostrando una aparente contradicción en su relación con las grandes empresas tecnológicas estadounidenses, posicionándose como su defensora frente a las regulaciones europeas mientras simultáneamente intensifica su propio escrutinio sobre ellas en el mercado doméstico

Jensen Huang advierte: Estados Unidos y China compiten cabeza a cabeza en chips de IA

La brecha tecnológica entre Estados Unidos y China en el sector de semiconductores para inteligencia artificial se estrecha aceleradamente, según declaraciones recientes del máximo ejecutivo de Nvidia, Jensen Huang