13NewsesUser-agent: * Allow: / User-agent: Googlebot-News Allow: /

La Realidad, lo más increíble que tenemos

La escasez de datos fiables amenaza el desarrollo de la inteligencia artificial

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM)
Tecnología02/04/2024 13news-Tecnología

La Newsletter de Gustavo Reija - Economista y CEO de NETIA GROUP

4 informes exclusivos cada mes, con el análisis de las tendencias macroeconómicas y políticas con perspectivas sobre mercados financieros y su impacto en la industria. Recomendaciones estratégicas para inversores y empresarios.

 Suscripción con MERCADOPAGO


 

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM). Esta situación podría obstaculizar el desarrollo de chatbots cada vez más avanzados y precisos, en un momento en que la carrera por ofrecer los mejores productos de IA se intensifica.

La importancia de los datos fiables en el entrenamiento de la IA
Los chatbots como ChatGPT de OpenAI se entrenan con grandes cantidades de información, como artículos científicos, noticias y entradas de Wikipedia. La calidad y fiabilidad de estos datos son fundamentales para que los modelos generen respuestas precisas y deseables. Sin embargo, se estima que para 2028, la demanda de datos de alta calidad superará la oferta de material de entrenamiento disponible, según Pablo Villalobos, experto en IA de la firma de investigación Epoch.

copilot-vs-chatgptCopilot versus ChatGPT, cuáles son los desafíos para Microsoft

Desafíos en la obtención de datos adecuados
Gran parte de la información pública disponible en internet no es adecuada para el entrenamiento de la IA debido a frases incompletas y otros defectos textuales. Además, la creciente cantidad de texto generado por la propia IA podría contaminar los modelos con sinsentidos, un fenómeno conocido como "colapso del modelo".

Restricciones de acceso a contenidos
Los principales medios de comunicación, plataformas de redes sociales y otras fuentes públicas han restringido el acceso a sus contenidos para el entrenamiento de la IA, citando preocupaciones sobre derechos de autor, privacidad y compensación justa. Asimismo, las personas se muestran reacias a que sus conversaciones y mensajes privados sean utilizados para estos fines.

En busca de nuevas fuentes de datos
Ante este panorama, las compañías están explorando nuevas fuentes de datos para mejorar sus herramientas. OpenAI, por ejemplo, está considerando entrenar GPT-5, su modelo más avanzado, con transcripciones de vídeos de YouTube. También se ha planteado la creación de un mercado de datos donde los proveedores puedan cobrar por contenidos valiosos para el entrenamiento de modelos. Google, por su parte, está estudiando un enfoque similar.

El potencial de los datos sintéticos
Algunas empresas están experimentando con "datos sintéticos" generados internamente para mejorar sus modelos. Anthropic ya ha incorporado este tipo de datos en Claude, su familia de chatbots de IA, mientras que OpenAI también estaría explorando esta posibilidad.

analisis-bitcoin-261219Bitcoin restablece métricas claves mientras el precio cae: Análisis técnico

Preocupaciones sobre la calidad de los chatbots
La escasez de datos coincide con las quejas de los usuarios sobre la calidad de los chatbots de IA. Algunos han reportado problemas con GPT-4 de OpenAI para seguir instrucciones y responder consultas, mientras que Google tuvo que pausar la función de generación de imágenes por IA de su modelo Gemini debido a inexactitudes históricas.

Conclusión
A medida que las empresas buscan soluciones para seguir entrenando sus modelos de IA, algunas parecen dispuestas a limitar el tamaño de sus sistemas. Sam Altman, CEO de OpenAI, sugiere que la era de los modelos gigantes podría estar llegando a su fin, y que las mejoras vendrán por otros caminos. En este contexto, la búsqueda de datos fiables se perfila como un desafío clave para el futuro desarrollo de la inteligencia artificial.

Claves
OIP

Fallo YPF: Milei festeja una victoria judicial que le da la razón a Kicillof y contradice dos años de su propio relato

Redacción 13News
Economía27/03/2026
La Cámara de Apelaciones del Segundo Circuito de Nueva York anuló la condena de USD 16.100 millones contra el Estado argentino por la expropiación de YPF en 2012. El fallo reconoce que la nacionalización se ajustó al ordenamiento jurídico argentino y al Congreso Nacional. La contradicción es estructural: el gobierno que durante dos años acusó a Kicillof de haber generado el mayor juicio de la historia argentina celebra ahora una sentencia que valida exactamente los argumentos jurídicos que Kicillof sostuvo desde el primer día.
Te puede interesar
OIP

Guerra de titanes IA: OpenAI busca u$s100.000 millones y Anthropic vale u$s380.000 millones; la carrera que redefine el capitalismo tecnológico global

Rocío Reija-Directora Marketing Digital
Tecnología19/02/2026
Dos rondas de financiación históricas en el mismo mes configuran un nuevo paradigma de concentración de capital en inteligencia artificial. Amazon, SoftBank, Nvidia y Microsoft apuestan cifras sin precedentes mientras surgen interrogantes sobre la sostenibilidad estructural del modelo.
Lo más visto
javier-milei-1687373

Milei al límite: escándalos, parálisis política, riesgo país en 600 puntos y 59% de la sociedad que ya no aguarda más

Redacción 13News
Economía22/03/2026
El 59% de los argentinos declaró que llegó al límite de su tolerancia,
el riesgo país superó los 600 puntos en una rueda en que el mundo
subía, el desempleo juvenil trepó al 16% y la interna de gabinete
dejó una reunión sin fotografías: la semana más difícil del programa
desde su lanzamiento, con la revisión del FMI a días de definirse.
o0U3uGsg5niwmte7

Argentina tiene litio, hidrógeno, mar y espacio: el plan desarrollista que el Gobierno ignora y que podría cambiar el destino económico del país para siempre

Federico Gonzalez
Política22/03/2026
Argentina posee el 22% de las reservas mundiales de litio, once millones
de kilómetros cuadrados de jurisdicción marítima, capacidad aeroespacial
verificada y condiciones excepcionales para hidrógeno verde y economía
del carbono. Federico González formula la tesis
disruptiva: el problema no es la escasez de recursos sino la ausencia
de inteligencia estratégica aplicada a su organización sistémica.
Un programa de desarrollo para las próximas dos décadas.
th?id=ONUT

Economía argentina: crece el índice, cae la industria y se hunde el consumo — la brecha que el EMAE no puede ocultar

Redacción 13News
Economía27/03/2026
El EMAE de enero de 2026 confirma el crecimiento más concentrado de la última década: agro, minería y finanzas traccionan el índice mientras manufactura, comercio y consumo masivo registran caídas simultáneas. Una radiografía sectorial que revela la distancia estructural entre el máximo histórico que celebra el Gobierno y la economía que procesan cotidianamente las familias y las pymes argentinas.
OIP

Fallo YPF: Milei festeja una victoria judicial que le da la razón a Kicillof y contradice dos años de su propio relato

Redacción 13News
Economía27/03/2026
La Cámara de Apelaciones del Segundo Circuito de Nueva York anuló la condena de USD 16.100 millones contra el Estado argentino por la expropiación de YPF en 2012. El fallo reconoce que la nacionalización se ajustó al ordenamiento jurídico argentino y al Congreso Nacional. La contradicción es estructural: el gobierno que durante dos años acusó a Kicillof de haber generado el mayor juicio de la historia argentina celebra ahora una sentencia que valida exactamente los argumentos jurídicos que Kicillof sostuvo desde el primer día.
Suscríbete al newsletter para recibir periódicamente las novedades en tu email
13NewsesUser-agent: * Allow: / User-agent: Googlebot-News Allow: /