Tecnología 13news-Tecnología 02 de abril de 2024

La escasez de datos fiables amenaza el desarrollo de la inteligencia artificial

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM)

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM). Esta situación podría obstaculizar el desarrollo de chatbots cada vez más avanzados y precisos, en un momento en que la carrera por ofrecer los mejores productos de IA se intensifica.

La importancia de los datos fiables en el entrenamiento de la IA
Los chatbots como ChatGPT de OpenAI se entrenan con grandes cantidades de información, como artículos científicos, noticias y entradas de Wikipedia. La calidad y fiabilidad de estos datos son fundamentales para que los modelos generen respuestas precisas y deseables. Sin embargo, se estima que para 2028, la demanda de datos de alta calidad superará la oferta de material de entrenamiento disponible, según Pablo Villalobos, experto en IA de la firma de investigación Epoch.

Copilot versus ChatGPT, cuáles son los desafíos para Microsoft

Desafíos en la obtención de datos adecuados
Gran parte de la información pública disponible en internet no es adecuada para el entrenamiento de la IA debido a frases incompletas y otros defectos textuales. Además, la creciente cantidad de texto generado por la propia IA podría contaminar los modelos con sinsentidos, un fenómeno conocido como "colapso del modelo".

Restricciones de acceso a contenidos
Los principales medios de comunicación, plataformas de redes sociales y otras fuentes públicas han restringido el acceso a sus contenidos para el entrenamiento de la IA, citando preocupaciones sobre derechos de autor, privacidad y compensación justa. Asimismo, las personas se muestran reacias a que sus conversaciones y mensajes privados sean utilizados para estos fines.

En busca de nuevas fuentes de datos
Ante este panorama, las compañías están explorando nuevas fuentes de datos para mejorar sus herramientas. OpenAI, por ejemplo, está considerando entrenar GPT-5, su modelo más avanzado, con transcripciones de vídeos de YouTube. También se ha planteado la creación de un mercado de datos donde los proveedores puedan cobrar por contenidos valiosos para el entrenamiento de modelos. Google, por su parte, está estudiando un enfoque similar.

El potencial de los datos sintéticos
Algunas empresas están experimentando con "datos sintéticos" generados internamente para mejorar sus modelos. Anthropic ya ha incorporado este tipo de datos en Claude, su familia de chatbots de IA, mientras que OpenAI también estaría explorando esta posibilidad.

Bitcoin restablece métricas claves mientras el precio cae: Análisis técnico

Preocupaciones sobre la calidad de los chatbots
La escasez de datos coincide con las quejas de los usuarios sobre la calidad de los chatbots de IA. Algunos han reportado problemas con GPT-4 de OpenAI para seguir instrucciones y responder consultas, mientras que Google tuvo que pausar la función de generación de imágenes por IA de su modelo Gemini debido a inexactitudes históricas.

Conclusión
A medida que las empresas buscan soluciones para seguir entrenando sus modelos de IA, algunas parecen dispuestas a limitar el tamaño de sus sistemas. Sam Altman, CEO de OpenAI, sugiere que la era de los modelos gigantes podría estar llegando a su fin, y que las mejoras vendrán por otros caminos. En este contexto, la búsqueda de datos fiables se perfila como un desafío clave para el futuro desarrollo de la inteligencia artificial.

Te puede interesar

OpenAI expande su imperio: las 9 industrias que Sam Altman busca revolucionar con inteligencia artificial

La compañía liderada por Altman trasciende sus orígenes como laboratorio de investigación. OpenAI compite ahora contra Google en búsquedas, desafía a Meta en redes sociales y planea fabricar chips propios. Inversiones millonarias en robótica, salud y dispositivos de consumo configuran estrategia de expansión agresiva

Eric Schmidt advierte que la IA "ya está aquí": transformará economía global en próxima década

El ex CEO de Google alertó sobre desafíos éticos, energéticos y sociales de la inteligencia artificial durante America Business Forum Miami 2025. Schmidt proyectó que cada persona tendrá "un Einstein en el bolsillo" dentro de diez años mientras centros de datos ya consumen 1% del PIB estadounidense

Disney pierde 26 millones de euros semanales por conflicto con YouTube TV: disputa por tarifas afecta transmisiones deportivas

El bloqueo de canales Disney en YouTube TV genera pérdidas de 3,7 millones de euros diarios según Morgan Stanley. La disputa mantiene ESPN y ABC fuera del servicio desde el 30 de octubre, afectando principalmente transmisiones deportivas como Monday Night Football en Estados Unidos

Bezos identifica qué trabajadores sobrevivirán a la automatización: "La IA no puede reemplazar la invención"

El fundador de Amazon defendió el valor del ingenio humano durante la Italian Tech Week 2025. Mientras su empresa acelera planes de automatización que afectarían 600.000 empleos hacia 2033, Bezos sostiene que los inventores estarán protegidos frente al avance de inteligencia artificial y robótica

Zuckerberg y Chan Apuestan Todo a Biohub: IA para Revolucionar la Investigación de Enfermedades

La fundación Chan Zuckerberg abandona educación y políticas públicas para concentrar USD 200.000 millones en biología impulsada por inteligencia artificial

CEO de Nvidia Advierte: China Puede Superar a EEUU en Inteligencia Artificial

Jensen Huang, director ejecutivo de Nvidia, intensificó sus críticas a las políticas estadounidenses sobre inteligencia artificial. Durante la cumbre del Financial Times, el CEO advirtió que el país asiático podría ganar la batalla tecnológica si Estados Unidos no cambia su estrategia regulatoria