La tecnológica estadounidense Microsoft anunció la eliminación de aproximadamente 9000 puestos laborales, convirtiéndose en la tercera iniciativa de reducción de personal que implementa la compañía durante 2025
Autoalimentación de la IA: El riesgo de usar datos sintéticos y su impacto en la calidad de los modelos
Un fenómeno preocupante está emergiendo: la autoalimentación de los modelos de IA con datos generados por la propia IA, lo que podría llevar a una degradación significativa en la calidad y coherencia de los resultados producidos
Tecnología03/08/2024 13News-Tecnología

La inteligencia artificial (IA) ha revolucionado numerosos campos, desde la generación de texto hasta la creación de imágenes. Sin embargo, un fenómeno preocupante está emergiendo: la autoalimentación de los modelos de IA con datos generados por la propia IA, lo que podría llevar a una degradación significativa en la calidad y coherencia de los resultados producidos.


El problema de los datos sintéticos
Los modelos de IA generativa, como ChatGPT, Midjourney o Dall-E, requieren una cantidad masiva de datos para su entrenamiento. Tradicionalmente, estos datos provenían de fuentes humanas en internet. Sin embargo, cada vez más, estos modelos se están alimentando con "datos sintéticos" - contenido generado artificialmente por otros sistemas de IA.
Esta práctica, aunque económica y conveniente para las empresas de IA, está generando preocupación en la comunidad científica. Según un estudio reciente publicado en la revista Nature, el uso excesivo de datos sintéticos puede llevar a una degradación progresiva de la calidad de los modelos de IA.
Consecuencias de la autoalimentación
Los investigadores han observado varios efectos negativos derivados de este fenómeno:
1. Pérdida de originalidad: Las respuestas y contenidos generados se vuelven cada vez menos originales.
2. Incoherencia creciente: Se observa un aumento en la producción de elementos incoherentes o sin sentido.
3. Reducción de la diversidad: La variedad de respuestas y contenidos tiende a disminuir con el tiempo.
4. Deterioro de la calidad general: Los modelos producen resultados cada vez menos pertinentes y útiles.
La analogía de las "vacas locas"
Los científicos han comparado este fenómeno con la crisis de las vacas locas que afectó al Reino Unido en los años 90. Así como la alimentación de vacas con harinas animales contaminadas llevó a la propagación de la enfermedad, la alimentación de modelos de IA con datos sintéticos podría "contaminar" progresivamente todo el ecosistema de internet.
Richard Baraniuk, uno de los autores del estudio de la Universidad de Rice, advierte que sin control, este proceso podría "envenenar la calidad y la diversidad de los datos en todo internet".
Perspectivas de la industria
La reacción de la industria de IA a estos hallazgos es mixta. Algunas empresas líderes, como Anthropic y Hugging Face, confirman el uso de datos generados por IA en sus modelos, pero argumentan que la situación no es tan grave como se presenta en los estudios académicos.
Anton Lozhkov, ingeniero de aprendizaje automático en Hugging Face, sostiene que el entrenamiento en múltiples series de datos sintéticos "simplemente no se hace en realidad". Sin embargo, reconoce la frustración de los expertos ante la calidad de los datos disponibles en internet, describiendo gran parte de ellos como "basura".
El dilema de los datos de calidad
El uso de datos sintéticos surge en parte de la escasez creciente de "fuentes de datos humanos sin explotar, de alta calidad", según explica Jathan Sadowski, investigador de la Universidad de Monash. Esta escasez plantea un desafío significativo para las empresas de IA que buscan mejorar constantemente sus modelos.
Implicaciones futuras y posibles soluciones
La comunidad científica y la industria de IA se enfrentan ahora a varios desafíos críticos:
1. Determinar el umbral óptimo de uso de datos sintéticos sin comprometer la calidad de los modelos.
2. Desarrollar métodos más eficaces para filtrar y limpiar los datos de entrenamiento, eliminando contenido de baja calidad o incoherente.
3. Explorar nuevas fuentes de datos de alta calidad generados por humanos.
4. Establecer estándares y regulaciones para el uso ético y responsable de datos en el entrenamiento de modelos de IA.
El fenómeno de autoalimentación de la IA presenta un desafío significativo para el futuro de esta tecnología. Aunque los datos sintéticos ofrecen una solución conveniente y económica para el entrenamiento de modelos, su uso excesivo podría llevar a una degradación progresiva de la calidad y utilidad de los sistemas de IA.
La industria y la comunidad científica deben colaborar para encontrar un equilibrio entre la eficiencia y la calidad, asegurando que los avances en IA continúen siendo beneficiosos y confiables. Solo a través de un enfoque consciente y ético en la selección y uso de datos de entrenamiento podremos garantizar un futuro prometedor para la inteligencia artificial.

¿Qué son los Modelos mundo?: la apuesta tecnológica para superar nuevos límites en desarrollo de Inteligencia Artificial
La carrera por dominar la inteligencia artificial ha tomado un giro inesperado. Mientras OpenAI y Anthropic continúan perfeccionando sus sistemas conversacionales, un selecto grupo de investigadores ha puesto sus miras en una tecnología radicalmente diferente que promete revolucionar nuestra comprensión de la IA
SoftBank y TSMC negocian megaproyecto de IA en EEUU por 1 billón de dólares
La industria tecnológica global presencia una de las propuestas más ambiciosas de la década cuando el magnate japonés Masayoshi Son presenta su visión para revolucionar la manufactura estadounidense de inteligencia artificial

¿Por qué WhatsApp es el campo batalla IA entre Meta y sus rivales?
La plataforma de mensajería instantánea más utilizada globalmente experimenta una transformación inesperada al convertirse en el escenario principal donde asistentes virtuales de inteligencia artificial compiten por la atención de usuarios, creando una paradoja estratégica para Meta que debe enfrentar la presencia de competidores directos dentro de su propio ecosistema

El Juego de Tronos de la Inteligencia Artificial: Génesis de una nueva era
Dentro de unas décadas, los libros de historia contarán esta gesta como una de las más determinantes de nuestro tiempo

Microsoft evalúa romper acuerdo con OpenAI por conflicto accionario
La corporación de Redmond considera mantener el contrato vigente si las negociaciones sobre la transformación empresarial de la creadora de ChatGPT no prosperan según sus expectativas

¿Qué relación hay entre la IA y la Paternidad? CEO tecnológico decide retrasar su paternidad hasta que Neuralink esté listo
El joven ejecutivo tecnológico Alexandr Wang ha tomado una decisión que refleja el nivel de confianza depositado por la nueva generación de empresarios en las interfaces cerebro-computador

Fabricante autos eléctricos BYD desestabiliza mercado chino con guerra de precios
Las autoridades chinas enfrentan un escenario sin precedentes en su sector automotriz tras las agresivas estrategias comerciales implementadas por BYD, el fabricante de vehículos eléctricos que ha desencadenado una espiral deflacionaria que amenaza la estabilidad de toda la industria

La carrera tecnológica por dominar la inteligencia artificial revela disparidades fundamentales entre los gigantes de Silicon Valley

La administración argentina presentó una solicitud judicial en Nueva York para detener temporalmente la ejecución de una sentencia multimillonaria relacionada con la nacionalización de la petrolera YPF hace más de una década

Rebelión de gobernadores pone en peligro el veto de Milei a la ley de jubilaciones
El respaldo legislativo al presidente Javier Milei enfrenta su momento más crítico desde el inicio de su gestión. La tensión entre el oficialismo y los mandatarios provinciales, sumada al enojo de sectores del radicalismo y del PRO, amenaza con derrumbar el escudo parlamentario que había logrado sostener los vetos presidenciales
Ola de frío y crísis energética: 100.000 usuarios sin luz y estaciones de servicio sin GNC
La ola polar que azotó Argentina durante esta semana desencadenó una crisis energética sin precedentes que dejó al descubierto las profundas vulnerabilidades de un sistema que arrastra décadas de deterioro estructural
La tecnológica estadounidense Microsoft anunció la eliminación de aproximadamente 9000 puestos laborales, convirtiéndose en la tercera iniciativa de reducción de personal que implementa la compañía durante 2025
:quality(85)/assets.iprofesional.com/assets/jpg/2024/12/588649_landscape.jpg)
Analistas prevén volatilidad en valor del Dólar en segundo semestre electoral
La divisa estadounidense experimentó una escalada significativa durante la primera semana de julio, acumulando un incremento de 40 pesos que la posicionó en los registros más elevados desde la eliminación del cepo cambiario

¿Hacía dónde va el mercado en EEUU? Grandes Inversores venden mientras BlackRock compra
El panorama financiero global presenta una dualidad intrigante que ha captado la atención de analistas especializados en los mercados internacionales
Milei exige libertad comercial al Mercosur o amenaza con flexibilizar vínculos
El presidente argentino Javier Milei planteó una disyuntiva fundamental durante la cumbre del Mercosur realizada en Buenos Aires: el bloque regional debe avanzar hacia una apertura comercial significativa o Argentina evaluará modificar las condiciones de su participación en la alianza
J.P. Morgan cierra Carry Trade en Argentina con 10,4% de ganancia en dólares en 73 días
El gigante financiero estadounidense J.P. Morgan materializó una rentabilidad excepcional del 10,4% en dólares durante una operación de carry trade ejecutada en el mercado argentino a lo largo de 73 días

FMI revisa programa argentino y no fija fecha para desembolsar los USD 2.000 millones del acuerdo, por incumplimiento en acumulación de reservas
La administración de Javier Milei enfrenta una encrucijada financiera después de que el Fondo Monetario Internacional suspendiera indefinidamente el desembolso de 2.000 millones de dólares correspondiente a la primera revisión del programa de Facilidades Extendidas