Tecnología 13news-Tecnología 02/04/2024

La escasez de datos fiables amenaza el desarrollo de la inteligencia artificial

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM)

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM). Esta situación podría obstaculizar el desarrollo de chatbots cada vez más avanzados y precisos, en un momento en que la carrera por ofrecer los mejores productos de IA se intensifica.

La importancia de los datos fiables en el entrenamiento de la IA
Los chatbots como ChatGPT de OpenAI se entrenan con grandes cantidades de información, como artículos científicos, noticias y entradas de Wikipedia. La calidad y fiabilidad de estos datos son fundamentales para que los modelos generen respuestas precisas y deseables. Sin embargo, se estima que para 2028, la demanda de datos de alta calidad superará la oferta de material de entrenamiento disponible, según Pablo Villalobos, experto en IA de la firma de investigación Epoch.

Copilot versus ChatGPT, cuáles son los desafíos para Microsoft

Desafíos en la obtención de datos adecuados
Gran parte de la información pública disponible en internet no es adecuada para el entrenamiento de la IA debido a frases incompletas y otros defectos textuales. Además, la creciente cantidad de texto generado por la propia IA podría contaminar los modelos con sinsentidos, un fenómeno conocido como "colapso del modelo".

Restricciones de acceso a contenidos
Los principales medios de comunicación, plataformas de redes sociales y otras fuentes públicas han restringido el acceso a sus contenidos para el entrenamiento de la IA, citando preocupaciones sobre derechos de autor, privacidad y compensación justa. Asimismo, las personas se muestran reacias a que sus conversaciones y mensajes privados sean utilizados para estos fines.

En busca de nuevas fuentes de datos
Ante este panorama, las compañías están explorando nuevas fuentes de datos para mejorar sus herramientas. OpenAI, por ejemplo, está considerando entrenar GPT-5, su modelo más avanzado, con transcripciones de vídeos de YouTube. También se ha planteado la creación de un mercado de datos donde los proveedores puedan cobrar por contenidos valiosos para el entrenamiento de modelos. Google, por su parte, está estudiando un enfoque similar.

El potencial de los datos sintéticos
Algunas empresas están experimentando con "datos sintéticos" generados internamente para mejorar sus modelos. Anthropic ya ha incorporado este tipo de datos en Claude, su familia de chatbots de IA, mientras que OpenAI también estaría explorando esta posibilidad.

Bitcoin restablece métricas claves mientras el precio cae: Análisis técnico

Preocupaciones sobre la calidad de los chatbots
La escasez de datos coincide con las quejas de los usuarios sobre la calidad de los chatbots de IA. Algunos han reportado problemas con GPT-4 de OpenAI para seguir instrucciones y responder consultas, mientras que Google tuvo que pausar la función de generación de imágenes por IA de su modelo Gemini debido a inexactitudes históricas.

Conclusión
A medida que las empresas buscan soluciones para seguir entrenando sus modelos de IA, algunas parecen dispuestas a limitar el tamaño de sus sistemas. Sam Altman, CEO de OpenAI, sugiere que la era de los modelos gigantes podría estar llegando a su fin, y que las mejoras vendrán por otros caminos. En este contexto, la búsqueda de datos fiables se perfila como un desafío clave para el futuro desarrollo de la inteligencia artificial.

Te puede interesar

¿El Fin del Monopolio de Google? La Distribución, no la Tecnología, Define el Futuro de las Búsquedas

El Departamento de Justicia de Estados Unidos (DOJ) ha sacudido los cimientos del imperio tecnológico de Google al proponer medidas que podrían desmantelar su dominio en el mercado de búsquedas en línea

Trump y la Nueva Carrera Armamentística de la IA: EEUU Prepara su 'Proyecto Manhattan' Digital contra China

En un momento crucial para la hegemonía tecnológica global, Estados Unidos está considerando lanzar un ambicioso programa comparable al histórico Proyecto Manhattan, esta vez enfocado en el desarrollo de la Inteligencia Artificial General (AGI)

xAI Supera el Valor de Twitter: La Nueva Apuesta de Musk en IA Alcanza los 47.500 Millones de Euros

La empresa está próxima a cerrar una nueva ronda de financiación que ha atraído a prominentes firmas de capital riesgo, incluyendo Sequoia Capital y Andreessen Horowitz

La Era de la IA Agentica: Nvidia Rompe Récords y Revoluciona el Futuro de la Computación

En medio de una transformación tecnológica sin precedentes, Nvidia ha reportado resultados financieros extraordinarios que confirman el dominio de la compañía en la revolución de la inteligencia artificial

Carrera Armamentista Digital: EE.UU. Propone un "Plan Manhattan de la IA" para Enfrentar a China

La batalla por la supremacía tecnológica entre Estados Unidos y China alcanza un nuevo nivel con la propuesta de una comisión bipartidista del Congreso estadounidense de lanzar un programa similar al histórico Proyecto Manhattan, esta vez enfocado en el desarrollo de inteligencia artificial general (AGI)

Ceo de Nvidia, Jensen Huang, predice un salto "de un millón" en potencia computacional para 2034

El CEO de Nvidia, Jensen Huang, ha lanzado una de las predicciones más audaces en la historia de la computación: la potencia de cálculo se multiplicará por un millón en los próximos diez años

Crisis en el gigante de la IA: El nuevo superchip de Nvidia enfrenta problemas críticos de sobrecalentamiento

El futuro de la inteligencia artificial podría retrasarse debido a un inesperado obstáculo técnico. Blackwell, el revolucionario chip de Nvidia que promete duplicar la velocidad de procesamiento en IA, enfrenta serios problemas de sobrecalentamiento que han obligado a la compañía a rediseñar sus sistemas de refrigeración

El Secreto detrás del Éxito de Nvidia: Cómo la Computación Paralela Revoluciona la Era de la IA

La reciente coronación de Nvidia como la empresa más valiosa del mundo no es producto del azar. Un concepto aparentemente simple, la computación paralela, combinado con una visión estratégica del futuro tecnológico, ha catapultado a la compañía hacia la cima del mercado global, transformando radicalmente el panorama de la inteligencia artificial

Brasil Reinventa su Futuro Digital: La IA se Convierte en Aliada Ambiental

Brasil está escribiendo un nuevo capítulo en la historia de la innovación empresarial, donde la inteligencia artificial emerge como protagonista en la lucha contra el cambio climático