La Realidad, lo más increíble que tenemos

¿Qué son los Modelos mundo?: la apuesta tecnológica para superar nuevos límites en desarrollo de Inteligencia Artificial

La carrera por dominar la inteligencia artificial ha tomado un giro inesperado. Mientras OpenAI y Anthropic continúan perfeccionando sus sistemas conversacionales, un selecto grupo de investigadores ha puesto sus miras en una tecnología radicalmente diferente que promete revolucionar nuestra comprensión de la IA

Tecnología30/06/2025 13News-Tecnología

 La Newsletter de Gustavo Reija - Economista-CEO NETIA GROUP

Informe Privado Semanal - Suscripción Mensual (4 informes) con MERCADOPAGO

Captura de pantalla 2025-03-22 191711

 

La carrera por dominar la inteligencia artificial ha tomado un giro inesperado. Mientras OpenAI y Anthropic continúan perfeccionando sus sistemas conversacionales, un selecto grupo de investigadores ha puesto sus miras en una tecnología radicalmente diferente que promete revolucionar nuestra comprensión de la IA. Se trata de los denominados modelos mundo, sistemas capaces de construir representaciones tridimensionales complejas que emulan la forma en que los humanos percibimos y procesamos la realidad.

Esta nueva frontera tecnológica ha atraído la atención de algunas de las mentes más brillantes del sector. Entre ellas destaca Fei-Fei Li, catedrática de Stanford reconocida mundialmente por crear ImageNet, quien ha puesto en marcha World Labs, una empresa que en 2024 logró captar 230 millones de dólares en su primera ronda de financiación. Los inversores que apostaron por este proyecto incluyen pesos pesados como Andreessen Horowitz, New Enterprise Associates y Radical Ventures, lo que evidencia el enorme potencial que el mercado ve en esta tecnología.

La propuesta de Li representa un cambio fundamental en la concepción de la inteligencia artificial. Durante una reciente intervención en el podcast de Andreessen Horowitz, la investigadora planteó una reflexión provocadora sobre las limitaciones inherentes a los sistemas actuales. Según su visión, el lenguaje constituye apenas una fracción de cómo los humanos experimentamos e interpretamos nuestro entorno. La civilización humana, argumenta, se ha construido a través de una comprensión espacial y temporal que trasciende las palabras.

carlos-melconian-economistaMelconian anticipa la necesidad de reformular el programa económico de Milei después de las elecciones de Octubre

Esta perspectiva encuentra eco en trabajos académicos previos. El profesor del MIT Jay Wright Forrester ya anticipaba en 1971 la importancia de los modelos mentales en su influyente trabajo sobre el comportamiento de los sistemas sociales. Forrester sostenía que todas las decisiones humanas, desde las más cotidianas hasta las más complejas políticas gubernamentales, se basan en representaciones simplificadas de la realidad que construimos mentalmente. Estas abstracciones nos permiten navegar un mundo de complejidad infinita mediante esquemas manejables que capturan las relaciones esenciales entre elementos.

La ambición de World Labs consiste precisamente en dotar a las máquinas de esta capacidad fundamental. Su objetivo declarado es trascender el mundo bidimensional de píxeles para crear sistemas que comprendan y generen entornos tridimensionales completos, tanto virtuales como físicos. Esta inteligencia espacial, como la denomina Li, implica no solo percibir el espacio sino también razonar sobre él, interactuar con objetos y predecir cómo evolucionarán las situaciones en tres dimensiones.

Paralelamente, en los laboratorios de Meta, otra figura legendaria de la IA trabaja en una dirección similar. Yann LeCun, galardonado con el Premio Turing y científico jefe de inteligencia artificial de la compañía, lidera un equipo dedicado a desarrollar estos modelos utilizando un enfoque innovador basado en datos de video. Su estrategia consiste en entrenar sistemas que generen representaciones abstractas de secuencias visuales, eliminando detalles impredecibles para centrarse en patrones fundamentales de cómo evoluciona el mundo físico.

gobernadores-patagonicosjpgTriple frente de ataque: Gobernadores presionan por fondos, déficit del sector externo y el JP Morgan recomendando desarmar Carry Trade

Durante una presentación en la AI Action Summit de París, LeCun expuso la filosofía detrás de su aproximación. En lugar de intentar predecir cada píxel individual en una secuencia de video, su equipo busca extraer representaciones abstractas que capturen la esencia de los cambios físicos. Esta abstracción permite al sistema hacer predicciones más robustas sobre estados futuros del mundo, similar a como los humanos anticipamos eventos sin necesidad de visualizar cada detalle.

Las aplicaciones potenciales de esta tecnología abarcan un espectro extraordinariamente amplio. En el campo creativo, podrían permitir la generación automática de mundos virtuales complejos para videojuegos o experiencias de realidad virtual. En robótica, facilitarían que las máquinas naveguen e interactúen con entornos desconocidos con la misma naturalidad que los humanos. Incluso en aplicaciones militares, como sugieren los desarrolladores, estos sistemas podrían proporcionar ventajas estratégicas al permitir una mejor comprensión situacional y anticipación de movimientos enemigos.

Sin embargo, el desarrollo de modelos mundo enfrenta desafíos técnicos formidables. El principal obstáculo radica en la disponibilidad de datos adecuados para el entrenamiento. Mientras que los modelos lingüísticos pueden aprovechar siglos de texto escrito acumulado por la humanidad, la captura y representación de información espacial tridimensional presenta complejidades únicas. Li ilustra este problema con un ejercicio mental revelador: aunque todos experimentamos constantemente el espacio tridimensional, muy pocos podríamos crear una representación precisa de nuestro entorno inmediato con los ojos cerrados.

como-invertir-en-el-indice-merval-1068x610CEDEARS resurgen como opción estrella para invertir en pesos ante recomendación del JP Morgan de desarmar posición en bonos

Esta escasez de datos espaciales estructurados requiere innovaciones en múltiples frentes. Los investigadores deben desarrollar nuevas técnicas de captura, procesamiento y síntesis de información tridimensional. Esto implica no solo avances en hardware de sensores sino también en algoritmos capaces de extraer patrones significativos de datos visuales y espaciales complejos.

La visión de LeCun sobre el futuro de la IA va más allá de mejoras incrementales en los sistemas actuales. Durante una conferencia en la Universidad Nacional de Singapur, el investigador esbozó las características que considera esenciales para alcanzar una inteligencia artificial verdaderamente comparable a la humana. Estos sistemas deberían poder aprender tareas nuevas rápidamente, comprender el mundo físico más allá del texto, demostrar sentido común y capacidad de planificación, y mantener memoria persistente de sus experiencias.

El contraste entre los modelos mundo y los sistemas lingüísticos actuales resulta fundamental para entender esta evolución. Los LLM, por sofisticados que sean, operan fundamentalmente mediante correlaciones estadísticas entre símbolos lingüísticos. Su comprensión del mundo se limita a patrones en texto, sin una verdadera aprehensión de las realidades físicas que esas palabras representan. Los modelos mundo, en cambio, aspiran a construir representaciones que capturen las dinámicas causales y espaciales del mundo real.

Todo-lo-que-necesita-saber-sobre-Internet-cuantica¿La Computación cuántica amenazará seguridad criptográfica del Bitcoin en 2-3 años?

Esta transición tecnológica podría marcar el inicio de una nueva era en la inteligencia artificial. Si los investigadores logran superar los desafíos técnicos actuales, estaríamos ante sistemas capaces no solo de procesar información sino de comprenderla en un sentido más profundo y humano. La inversión masiva en empresas como World Labs sugiere que el mercado percibe este potencial transformador.

El desarrollo de modelos mundo representa así la próxima frontera en la evolución de la inteligencia artificial. Mientras las grandes tecnológicas continúan refinando sus chatbots y asistentes virtuales, pioneros como Li y LeCun están sentando las bases para sistemas que podrían redefinir nuestra relación con las máquinas inteligentes. Su éxito o fracaso determinará no solo el futuro de la IA sino también nuestra capacidad para crear tecnologías que verdaderamente comprendan y naveguen la complejidad del mundo físico que habitamos.

Te puede interesar
meta-ai-2966810

¿Por qué WhatsApp es el campo batalla IA entre Meta y sus rivales?

13News-Tecnología
Tecnología26/06/2025

La plataforma de mensajería instantánea más utilizada globalmente experimenta una transformación inesperada al convertirse en el escenario principal donde asistentes virtuales de inteligencia artificial compiten por la atención de usuarios, creando una paradoja estratégica para Meta que debe enfrentar la presencia de competidores directos dentro de su propio ecosistema

Lo más visto
th?id=OIP

Bancos de EEUU advierten riesgo cambiario en Argentina

13News-Economía
Economía27/06/2025

Los principales centros financieros internacionales han comenzado a expresar preocupaciones crecientes sobre la sostenibilidad de la política cambiaria argentina, coincidiendo con la divulgación de indicadores que revelan una aceleración en el drenaje de divisas del sistema económico nacional

bitcoin-e1613393987438

¿Pueden los bonos de deuda con respaldo en Bitcoin ser una alternativa contra la crisis fiscal de EEUU?

13News-Cripto
Cripto29/06/2025

Una propuesta innovadora emerge desde el sector financiero estadounidense para combatir el creciente problema de endeudamiento nacional que alcanza cifras históricas. Matthew Pines, Director Ejecutivo del Bitcoin Policy Institute, presenta los denominados Bitbonds como alternativa viable para reducir tasas de interés sin generar costos adicionales al contribuyente americano

Suscríbete al newsletter para recibir periódicamente las novedades en tu email