Tecnología 13news-Tecnología 02/04/2024

La escasez de datos fiables amenaza el desarrollo de la inteligencia artificial

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM)

En el vertiginoso mundo de la inteligencia artificial (IA), las empresas líderes como OpenAI y Anthropic se enfrentan a un desafío crucial: la escasez de datos fiables para entrenar sus modelos lingüísticos (LLM). Esta situación podría obstaculizar el desarrollo de chatbots cada vez más avanzados y precisos, en un momento en que la carrera por ofrecer los mejores productos de IA se intensifica.

La importancia de los datos fiables en el entrenamiento de la IA
Los chatbots como ChatGPT de OpenAI se entrenan con grandes cantidades de información, como artículos científicos, noticias y entradas de Wikipedia. La calidad y fiabilidad de estos datos son fundamentales para que los modelos generen respuestas precisas y deseables. Sin embargo, se estima que para 2028, la demanda de datos de alta calidad superará la oferta de material de entrenamiento disponible, según Pablo Villalobos, experto en IA de la firma de investigación Epoch.

Copilot versus ChatGPT, cuáles son los desafíos para Microsoft

Desafíos en la obtención de datos adecuados
Gran parte de la información pública disponible en internet no es adecuada para el entrenamiento de la IA debido a frases incompletas y otros defectos textuales. Además, la creciente cantidad de texto generado por la propia IA podría contaminar los modelos con sinsentidos, un fenómeno conocido como "colapso del modelo".

Restricciones de acceso a contenidos
Los principales medios de comunicación, plataformas de redes sociales y otras fuentes públicas han restringido el acceso a sus contenidos para el entrenamiento de la IA, citando preocupaciones sobre derechos de autor, privacidad y compensación justa. Asimismo, las personas se muestran reacias a que sus conversaciones y mensajes privados sean utilizados para estos fines.

En busca de nuevas fuentes de datos
Ante este panorama, las compañías están explorando nuevas fuentes de datos para mejorar sus herramientas. OpenAI, por ejemplo, está considerando entrenar GPT-5, su modelo más avanzado, con transcripciones de vídeos de YouTube. También se ha planteado la creación de un mercado de datos donde los proveedores puedan cobrar por contenidos valiosos para el entrenamiento de modelos. Google, por su parte, está estudiando un enfoque similar.

El potencial de los datos sintéticos
Algunas empresas están experimentando con "datos sintéticos" generados internamente para mejorar sus modelos. Anthropic ya ha incorporado este tipo de datos en Claude, su familia de chatbots de IA, mientras que OpenAI también estaría explorando esta posibilidad.

Bitcoin restablece métricas claves mientras el precio cae: Análisis técnico

Preocupaciones sobre la calidad de los chatbots
La escasez de datos coincide con las quejas de los usuarios sobre la calidad de los chatbots de IA. Algunos han reportado problemas con GPT-4 de OpenAI para seguir instrucciones y responder consultas, mientras que Google tuvo que pausar la función de generación de imágenes por IA de su modelo Gemini debido a inexactitudes históricas.

Conclusión
A medida que las empresas buscan soluciones para seguir entrenando sus modelos de IA, algunas parecen dispuestas a limitar el tamaño de sus sistemas. Sam Altman, CEO de OpenAI, sugiere que la era de los modelos gigantes podría estar llegando a su fin, y que las mejoras vendrán por otros caminos. En este contexto, la búsqueda de datos fiables se perfila como un desafío clave para el futuro desarrollo de la inteligencia artificial.

Te puede interesar

Trump aprueba la venta de la red social Tik Tok por 14.000 millones de dólares a consorcio

La administración estadounidense formalizó mediante orden ejecutiva la autorización para que un consorcio empresarial doméstico adquiera las operaciones de la plataforma china en territorio norteamericano

Nvidia apuesta 5.000 millones por Intel en crisis

La industria de semiconductores presenció esta semana una de las alianzas más significativas de los últimos años cuando Nvidia confirmó una inversión estratégica de 5.000 millones de dólares en Intel, marcando un punto de inflexión para el fabricante de procesadores que atraviesa su peor crisis en décadas

Microsoft rechaza derechos para la IA: "mimetismo, no conciencia"

La industria de la inteligencia artificial experimenta un debate fundamental sobre la naturaleza de los sistemas automatizados avanzados y si estos merecen algún tipo de consideración moral o protección legal

OpenAI ofrece u$d 393.000 por "estratega de contenido", nueva era salarial de la Inteligencia Artificial

La revolución de la inteligencia artificial está redefiniendo completamente el mercado laboral de contenidos digitales, transformando profesiones tradicionalmente subestimadas en posiciones estratégicas con remuneraciones extraordinarias

Gigantes tecnológicos halagan a Trump en cumbre de IA

La Casa Blanca se convirtió en epicentro de una convergencia estratégica sin precedentes entre el poder político estadounidense y los principales referentes de la industria tecnológica global

Gemini 2.5 Flash: Google desafía dominio de Photoshop

La industria del software de edición gráfica enfrenta una disrupción tecnológica significativa tras el lanzamiento oficial de Gemini 2.5 Flash, la propuesta de inteligencia artificial de Google que amenaza directamente el liderazgo histórico de Adobe Photoshop en el mercado de manipulación digital de imágenes

Chatbots de compañía dominan el 20% del mercado global de IA

El ecosistema de aplicaciones de inteligencia artificial presenta una composición mucho más diversa y controversial de lo que cabría esperar, según revela el más reciente análisis semestral publicado por la prestigiosa firma de inversión Andreessen Horowitz

Trump invierte en Intel y prepara más adquisiciones en tecnológicas

La administración estadounidense estableció un precedente sin antecedentes al adquirir una participación del 10% en Intel Corporation, marcando el inicio de una estrategia intervencionista que el presidente Donald Trump planea extender hacia otras compañías estratégicas del país

Spotify integra mensajería instantánea para retener usuarios: ¿Una nueva red social?

La plataforma de streaming musical Spotify implementa una transformación estratégica significativa al incorporar capacidades de comunicación directa entre sus usuarios, marcando su evolución hacia un ecosistema social más completo