13NewsesUser-agent: * Allow: / User-agent: Googlebot-News Allow: /

La Realidad, lo más increíble que tenemos

La crisis silenciosa de la IA: Cuando los datos reales se agotan y lo sintético toma el relevo

El combustible que alimenta los motores de la IA, los datos del mundo real, se está agotando a un ritmo alarmante, obligando a la industria a buscar alternativas innovadoras y, en ocasiones, controvertidas
Tecnología04/09/2024 13News-Tecnología

La Newsletter de Gustavo Reija - Economista y CEO de NETIA GROUP

4 informes exclusivos cada mes, con el análisis de las tendencias macroeconómicas y políticas con perspectivas sobre mercados financieros y su impacto en la industria. Recomendaciones estratégicas para inversores y empresarios.

 Suscripción con MERCADOPAGO


 

En el vertiginoso mundo de la inteligencia artificial, una crisis se está gestando en silencio, amenazando con frenar el avance de una tecnología que promete revolucionar nuestra forma de vida y trabajo. El combustible que alimenta los motores de la IA, los datos del mundo real, se está agotando a un ritmo alarmante, obligando a la industria a buscar alternativas innovadoras y, en ocasiones, controvertidas.

Schneider_Electric.original-Centros-de-datosLa huella invisible de la revolución digital: El impacto ambiental de los centros de datos

La Epoch AI, una firma de investigación líder en el sector, ha lanzado una advertencia que ha sacudido los cimientos de la comunidad tecnológica: los datos de texto podrían agotarse tan pronto como en 2028. Esta predicción ha desencadenado una carrera frenética por encontrar soluciones, con los datos sintéticos emergiendo como la alternativa más prometedora y, a la vez, más cuestionada.

Los gigantes tecnológicos como OpenAI, Google y Meta, que han construido sus imperios de IA sobre montañas de información extraída de internet, se enfrentan ahora a un panorama desolador. Los datos generados por humanos a lo largo de siglos, desde investigaciones académicas hasta contenido multimedia, han sido procesados y utilizados para entrenar los modelos de lenguaje que impulsan herramientas como ChatGPT. Sin embargo, este tesoro de información se está agotando rápidamente.

th?id=OVFTLa industria argentina pide oxígeno: el proyecto de ley pyme que podría reactivar el sector

Sam Altman, CEO de OpenAI, ha sido uno de los primeros en reconocer públicamente esta crisis y proponer una solución audaz: que los propios modelos de IA generen datos sintéticos lo suficientemente buenos para entrenarse a sí mismos. Esta propuesta ha dividido a la comunidad científica y tecnológica, generando un debate intenso sobre la viabilidad y las implicaciones éticas de tal enfoque.

La idea de utilizar datos sintéticos no es nueva, pero su relevancia ha aumentado exponencialmente en los últimos años. Gartner, una firma de investigación respetada en el ámbito tecnológico, predijo en 2021 que para 2024, el 60% de los datos utilizados en el desarrollo de IA serían generados sintéticamente. Esta predicción parece estar cumpliéndose a medida que más empresas recurren a esta alternativa ante la escasez de datos reales.

El atractivo de los datos sintéticos es evidente. Ofrecen la posibilidad de generar información de forma barata y aparentemente infinita, sin las limitaciones y los problemas éticos asociados a la recopilación de datos del mundo real. Además, pueden ser diseñados para llenar vacíos específicos en los conjuntos de datos existentes y para contrarrestar sesgos presentes en la información generada por humanos.

825ed5347155552441f5f2b931f59da7Punto crítico en Gaza: EEUU presiona a Israel por la tregua mientras Netanyahu mantiene su postura

Sin embargo, el camino hacia un futuro dominado por datos sintéticos está lleno de obstáculos y preguntas sin responder. Un estudio reciente realizado por investigadores de las universidades de Oxford y Cambridge ha puesto de manifiesto uno de los principales riesgos: alimentar un modelo de IA exclusivamente con datos generados por inteligencia artificial puede llevar a la generación de incoherencias y a un deterioro en la calidad de los resultados.

Este fenómeno, denominado por algunos expertos como "colapso del modelo" o, de manera más colorida, "la IA de los Habsburgo" (en referencia a la dinastía austriaca que sufrió los efectos de la endogamia), plantea serias preocupaciones sobre la viabilidad a largo plazo de los datos sintéticos como solución única.

La industria está respondiendo a estos desafíos de diversas maneras. Algunas empresas, como Nvidia y Tencent, están desarrollando modelos específicamente diseñados para generar conjuntos de datos sintéticos de alta calidad. Otras, como Meta, están explorando enfoques híbridos que combinan datos reales y sintéticos en el proceso de entrenamiento de sus modelos.

th?id=OIPWall Street titubea y el petróleo se desploma: Mercados en vilo ante datos de empleo e incertidumbre global

El caso de Meta es particularmente interesante. Su reciente lanzamiento de Llama 3.1 utiliza datos sintéticos para "refinar" el entrenamiento en habilidades específicas, como la programación y la resolución de problemas matemáticos. Sin embargo, la empresa ha sido cautelosa al señalar que el uso exclusivo de datos sintéticos para entrenar modelos más grandes "no es útil" y puede incluso "degradar el rendimiento".

Esta experiencia subraya la complejidad del desafío que enfrenta la industria. No se trata simplemente de reemplazar datos reales por sintéticos, sino de encontrar el equilibrio adecuado que permita a los modelos de IA seguir mejorando sin perder su conexión con el mundo real.

Mientras tanto, la escasez de datos está llevando a las empresas a adoptar estrategias que hace unos años habrían parecido impensables. Gigantes como OpenAI y Google están pagando sumas millonarias por acceder a datos de foros en línea y medios de comunicación. Esta práctica, aunque costosa, refleja la desesperación del sector por obtener información fresca y relevante.

0e725283650cc3d6d3bc869cb8b71ff2Lollapalooza Argentina 2025: Un festival de contrastes que celebra una década de música

Sin embargo, incluso esta estrategia tiene sus límites. Los propietarios de contenido en línea están cada vez más conscientes del valor de sus datos y están implementando medidas para restringir el acceso de las empresas de IA. Esta tendencia está acelerando aún más la transición hacia los datos sintéticos.

En medio de este panorama complejo, algunas voces en la industria están llamando a replantear completamente el enfoque actual de la IA. Gary Marcus, analista especializado en inteligencia artificial y profesor emérito de la Universidad de Nueva York, argumenta que el problema fundamental de los sistemas actuales es su incapacidad para razonar y planificar verdaderamente. Según Marcus, ninguna cantidad de datos sintéticos podrá resolver esta limitación inherente.

Esta perspectiva abre la puerta a enfoques alternativos, como el "neuro-simbólico" demostrado por Google DeepMind con su sistema AlphaGeometry. Este enfoque, que combina el aprendizaje profundo con el razonamiento lógico basado en reglas, podría representar un camino prometedor hacia una IA más avanzada y menos dependiente de grandes cantidades de datos.

elon-musk-xAI-scaledColossus de xAI: ¿El gigante que revolucionará la inteligencia artificial o un alarde tecnológico de Musk?

A medida que la industria navega por estas aguas turbulentas, es crucial mantener un equilibrio entre la innovación y la precaución. Los datos sintéticos ofrecen oportunidades emocionantes, pero también conllevan riesgos significativos. La solución probablemente no sea un enfoque único, sino una combinación cuidadosa de múltiples estrategias.

El futuro de la IA dependerá de cómo la industria aborde esta crisis de datos. ¿Podrán los datos sintéticos proporcionar el combustible necesario para impulsar la próxima generación de modelos de IA? ¿O será necesario un replanteamiento fundamental de cómo desarrollamos y entrenamos estos sistemas?

Lo que está claro es que nos encontramos en un punto de inflexión crucial para la inteligencia artificial. Las decisiones que se tomen ahora determinarán no solo el futuro de esta tecnología, sino también cómo interactuará con nuestra sociedad en las próximas décadas. A medida que avanzamos, será esencial mantener un diálogo abierto y crítico sobre los beneficios y los riesgos de las diferentes aproximaciones, asegurando que el desarrollo de la IA siga siendo ético, sostenible y, sobre todo, beneficioso para la humanidad en su conjunto.

Claves
OIP

Argentina ahorró USD 16.100 millones con el fallo YPF pero no tiene política industrial: industria en mínimo de 90 años y 22.608 empresas cerradas desde 2023

Redacción 13News
Economía28/03/2026
Semana del 21 al 27 de marzo de 2026: fallo YPF revierte condena de USD 16.100 millones ante la Cámara de Apelaciones de Nueva York; EMAE enero 2026 marca máximo histórico con industria manufacturera en caída interanual del 2,6% y participación mínima en el PIB en noventa años; consumo masivo acumula contracción del 2,1% en el bimestre enero-febrero; 22.608 empresas cerradas desde noviembre de 2023. Análisis cuantitativo e interpretación estructural de la semana que definió el mapa de tensiones del tercer año del programa de estabilización argentino.
Te puede interesar
OIP

Guerra de titanes IA: OpenAI busca u$s100.000 millones y Anthropic vale u$s380.000 millones; la carrera que redefine el capitalismo tecnológico global

Rocío Reija-Directora Marketing Digital
Tecnología19/02/2026
Dos rondas de financiación históricas en el mismo mes configuran un nuevo paradigma de concentración de capital en inteligencia artificial. Amazon, SoftBank, Nvidia y Microsoft apuestan cifras sin precedentes mientras surgen interrogantes sobre la sostenibilidad estructural del modelo.
Lo más visto
OIP

Dólar a $1.420 con inflación al 3% mensual: el atraso cambiario silencioso que acumula tensión y amenaza la competitividad exportadora argentina en 2026

Redacción 13News
Economía21/03/2026
El tipo de cambio oficial se mantiene estabilizado en torno a los $1.400 desde hace seis meses mientras la inflación acumula una erosión real acelerada: el tipo de cambio real multilateral se apreció 7,7% en lo que va de 2026 y retrocedió a niveles comparables con los de 2017, alejándose del piso de competitividad que el propio FMI definió como referencia mínima en su acuerdo vigente. El dólar paralelo, a valores constantes, se ubica en los niveles más bajos de la última década. La estabilidad nominal es funcional al esquema antiinflacionario de corto plazo pero acumula vulnerabilidades estructurales que la tradición desarrollista identifica con precisión: erosión de la rentabilidad exportadora manufacturera, desincentivo a la sustitución de importaciones y dependencia creciente de precios internacionales favorables para sostener un equilibrio que la política cambiaria no puede garantizar de forma endógena.
OIP

Inflación de marzo 2026 bajo presión máxima: tarifas +11,4%, carne +27,6% en cuatro meses y naftas +15% destruyen el poder adquisitivo y amenazan el "cero inflación" de agosto que promete Milei

Redacción 13News
Economía21/03/2026
La canasta de servicios públicos del AMBA trepó 11,4% en marzo, la carne acumuló 27,6% de suba entre noviembre y febrero —más del doble que el IPC en igual período— y las naftas aumentaron hasta 15% en la primera semana del mes por el impacto del conflicto en Medio Oriente sobre el precio internacional del crudo. El gasto mensual en luz, gas, agua y transporte de un hogar promedio supera los $213.000, equivalente al 12,3% del salario registrado promedio, contra 10,8% en marzo de 2025. 
th?id=ONUT

Economía argentina: crece el índice, cae la industria y se hunde el consumo — la brecha que el EMAE no puede ocultar

Redacción 13News
Economía27/03/2026
El EMAE de enero de 2026 confirma el crecimiento más concentrado de la última década: agro, minería y finanzas traccionan el índice mientras manufactura, comercio y consumo masivo registran caídas simultáneas. Una radiografía sectorial que revela la distancia estructural entre el máximo histórico que celebra el Gobierno y la economía que procesan cotidianamente las familias y las pymes argentinas.
OIP

Fallo YPF: Milei festeja una victoria judicial que le da la razón a Kicillof y contradice dos años de su propio relato

Redacción 13News
Economía27/03/2026
La Cámara de Apelaciones del Segundo Circuito de Nueva York anuló la condena de USD 16.100 millones contra el Estado argentino por la expropiación de YPF en 2012. El fallo reconoce que la nacionalización se ajustó al ordenamiento jurídico argentino y al Congreso Nacional. La contradicción es estructural: el gobierno que durante dos años acusó a Kicillof de haber generado el mayor juicio de la historia argentina celebra ahora una sentencia que valida exactamente los argumentos jurídicos que Kicillof sostuvo desde el primer día.
OIP

Argentina ahorró USD 16.100 millones con el fallo YPF pero no tiene política industrial: industria en mínimo de 90 años y 22.608 empresas cerradas desde 2023

Redacción 13News
Economía28/03/2026
Semana del 21 al 27 de marzo de 2026: fallo YPF revierte condena de USD 16.100 millones ante la Cámara de Apelaciones de Nueva York; EMAE enero 2026 marca máximo histórico con industria manufacturera en caída interanual del 2,6% y participación mínima en el PIB en noventa años; consumo masivo acumula contracción del 2,1% en el bimestre enero-febrero; 22.608 empresas cerradas desde noviembre de 2023. Análisis cuantitativo e interpretación estructural de la semana que definió el mapa de tensiones del tercer año del programa de estabilización argentino.
Suscríbete al newsletter para recibir periódicamente las novedades en tu email
13NewsesUser-agent: * Allow: / User-agent: Googlebot-News Allow: /