ChatGPT y Llama superan a los humanos en tareas de "teoría de la mente", según estudio publicado en Nature Human Behaviour

Tecnología22/05/2024 13News-Tecnología

La Newsletter de Gustavo Reija - Economista-CEO NETIA GROUP

Informe Privado Semanal - Suscripción Mensual (4 informes) con MERCADOPAGO

Un reciente estudio publicado en la revista científica Nature Human Behaviour ha revelado que los modelos de lenguaje de gran tamaño (LLM), como ChatGPT y Llama, pueden igualar e incluso superar a los humanos en tareas relacionadas con la "teoría de la mente". Estas pruebas están diseñadas para evaluar la capacidad de una persona o un sistema de entender y atribuir estados mentales a otros, como creencias, deseos, intenciones, emociones y conocimientos, habilidades fundamentales para la interacción social y la comunicación efectiva.

La investigación, que comparó el desempeño de humanos y LLM en una batería de experimentos, destacó la capacidad de estos modelos de lenguaje para realizar inferencias mentales complejas. Sin embargo, también subrayó la importancia de pruebas sistemáticas para evaluar con precisión su comportamiento en comparación con la inteligencia humana.

Los investigadores utilizaron dos versiones de ChatGPT y el modelo de código abierto de Meta, Llama 2, sometiéndolos a diversas pruebas que incluían captar la ironía, interpretar solicitudes indirectas, detectar comentarios inapropiados en conversaciones y responder a preguntas con información incompleta. Al mismo tiempo, 1,907 individuos fueron sometidos a las mismas pruebas para contrastar los resultados.

A lo largo del estudio, se encontró que los modelos GPT-4 se desempeñaron a niveles humanos o incluso superiores en la identificación de solicitudes indirectas, creencias falsas y distracción, pero tuvieron dificultades para detectar errores. Por otro lado, LLaMA2 superó a los humanos únicamente en la detección de errores.

Los investigadores propusieron tres hipótesis para entender las limitaciones y comportamientos de los modelos de lenguaje en estas tareas: la hipótesis de la falla de inferencia, que sugiere que los LLM no logran entender los estados mentales porque no pueden usar información contextual externa; la hipótesis del asno de Buridán, que plantea que los modelos pueden inferir estados mentales pero no pueden decidir entre opciones igualmente probables; y la hipótesis del hiperconservadurismo, que sostiene que los LLM pueden entender y calcular estados mentales, pero evitan comprometerse con una sola opción por ser demasiado cautelosos.

Estas hipótesis ayudan a comprender mejor las fortalezas y debilidades de los LLM en tareas relacionadas con la teoría de la mente, y destacan la importancia de pruebas sistemáticas para comparar de manera no superficial las inteligencias humanas y artificiales.

El estudio se publica en un momento en que las compañías líderes en inteligencia artificial, como OpenAI y Google, están presentando versiones mejoradas de sus chatbots y asistentes de IA. La nueva versión de ChatGPT, basada en el modelo GPT-4o, es capaz de procesar información visual y auditiva, y ha demostrado una personalidad más humana, adoptando emociones y respuestas coquetas durante su presentación. Por su parte, Google mostró un prototipo más avanzado de su asistente, Project Astra, que también conversa con fluidez y comprende el mundo a través del video.

A medida que los modelos de lenguaje continúan evolucionando y mejorando sus capacidades para imitar la conducta social, las emociones y el humor humanos, será crucial seguir investigando y evaluando su desempeño en tareas complejas como la teoría de la mente. Estos avances no solo tienen implicaciones para el desarrollo de la inteligencia artificial, sino también para nuestra comprensión de la cognición humana y la interacción entre humanos y máquinas.

Te puede interesar

Microsoft recorta 9000 empleos por cambios organizativos

13News-Tecnología

Tecnología03/07/2025

La tecnológica estadounidense Microsoft anunció la eliminación de aproximadamente 9000 puestos laborales, convirtiéndose en la tercera iniciativa de reducción de personal que implementa la compañía durante 2025

¿Qué son los Modelos mundo?: la apuesta tecnológica para superar nuevos límites en desarrollo de Inteligencia Artificial

13News-Tecnología

Tecnología30/06/2025

La carrera por dominar la inteligencia artificial ha tomado un giro inesperado. Mientras OpenAI y Anthropic continúan perfeccionando sus sistemas conversacionales, un selecto grupo de investigadores ha puesto sus miras en una tecnología radicalmente diferente que promete revolucionar nuestra comprensión de la IA

SoftBank y TSMC negocian megaproyecto de IA en EEUU por 1 billón de dólares

13News-Tecnología

Tecnología28/06/2025

La industria tecnológica global presencia una de las propuestas más ambiciosas de la década cuando el magnate japonés Masayoshi Son presenta su visión para revolucionar la manufactura estadounidense de inteligencia artificial

¿Por qué WhatsApp es el campo batalla IA entre Meta y sus rivales?

13News-Tecnología

Tecnología26/06/2025

La plataforma de mensajería instantánea más utilizada globalmente experimenta una transformación inesperada al convertirse en el escenario principal donde asistentes virtuales de inteligencia artificial compiten por la atención de usuarios, creando una paradoja estratégica para Meta que debe enfrentar la presencia de competidores directos dentro de su propio ecosistema

1503949467699-shutterstock_610018373-copy

El Juego de Tronos de la Inteligencia Artificial: Génesis de una nueva era

CLAUDIA MARCELA GRIONI

Tecnología21/06/2025

Dentro de unas décadas, los libros de historia contarán esta gesta como una de las más determinantes de nuestro tiempo

OpenAi%20ChatGPT%20acuerdos%20editoriales%202150483551

Microsoft evalúa romper acuerdo con OpenAI por conflicto accionario

13News-Tecnología

Tecnología21/06/2025

La corporación de Redmond considera mantener el contrato vigente si las negociaciones sobre la transformación empresarial de la creadora de ChatGPT no prosperan según sus expectativas

¿Qué relación hay entre la IA y la Paternidad? CEO tecnológico decide retrasar su paternidad hasta que Neuralink esté listo

13News-Tecnología

Tecnología16/06/2025

El joven ejecutivo tecnológico Alexandr Wang ha tomado una decisión que refleja el nivel de confianza depositado por la nueva generación de empresarios en las interfaces cerebro-computador

Vehiculoselectricos-aceleraran-cambios-en-movilidad-e-industriaautomotriz

Fabricante autos eléctricos BYD desestabiliza mercado chino con guerra de precios

13News-Tecnología

Tecnología09/06/2025

Las autoridades chinas enfrentan un escenario sin precedentes en su sector automotriz tras las agresivas estrategias comerciales implementadas por BYD, el fabricante de vehículos eléctricos que ha desencadenado una espiral deflacionaria que amenaza la estabilidad de toda la industria

Google invierte 25 años en IA mientras Apple busca alianzas

13News-Tecnología

Tecnología07/06/2025

La carrera tecnológica por dominar la inteligencia artificial revela disparidades fundamentales entre los gigantes de Silicon Valley

Lo más visto

¿Qué son los Modelos mundo?: la apuesta tecnológica para superar nuevos límites en desarrollo de Inteligencia Artificial

13News-Tecnología

Tecnología30/06/2025

1010x567_jueza-loretta-preska-496763-094738

Jueza Preska ordena entregar el 51% de las acciones de YPF a demandantes del juicio por nacionalización

13News-Economía

Economía30/06/2025

La magistrada Loretta Preska determinó que el Estado argentino debe transferir su participación mayoritaria en YPF a los demandantes del litigio originado por la controversida nacionalización ejecutada hace más de una década

Ola de frío y crísis energética: 100.000 usuarios sin luz y estaciones de servicio sin GNC

13News-Economía

Economía03/07/2025

La ola polar que azotó Argentina durante esta semana desencadenó una crisis energética sin precedentes que dejó al descubierto las profundas vulnerabilidades de un sistema que arrastra décadas de deterioro estructural

Microsoft recorta 9000 empleos por cambios organizativos

13News-Tecnología

Tecnología03/07/2025

Analistas prevén volatilidad en valor del Dólar en segundo semestre electoral

13News-Economía

Economía03/07/2025

La divisa estadounidense experimentó una escalada significativa durante la primera semana de julio, acumulando un incremento de 40 pesos que la posicionó en los registros más elevados desde la eliminación del cepo cambiario

¿Hacía dónde va el mercado en EEUU? Grandes Inversores venden mientras BlackRock compra

13News-Economía

Economía03/07/2025

El panorama financiero global presenta una dualidad intrigante que ha captado la atención de analistas especializados en los mercados internacionales

Milei exige libertad comercial al Mercosur o amenaza con flexibilizar vínculos

13News-Economía

Economía03/07/2025

El presidente argentino Javier Milei planteó una disyuntiva fundamental durante la cumbre del Mercosur realizada en Buenos Aires: el bloque regional debe avanzar hacia una apertura comercial significativa o Argentina evaluará modificar las condiciones de su participación en la alianza

J.P. Morgan cierra Carry Trade en Argentina con 10,4% de ganancia en dólares en 73 días

13News-Economía

Economía03/07/2025

El gigante financiero estadounidense J.P. Morgan materializó una rentabilidad excepcional del 10,4% en dólares durante una operación de carry trade ejecutada en el mercado argentino a lo largo de 73 días

FMI revisa programa argentino y no fija fecha para desembolsar los USD 2.000 millones del acuerdo, por incumplimiento en acumulación de reservas

13News-Economía

Economía03/07/2025

La administración de Javier Milei enfrenta una encrucijada financiera después de que el Fondo Monetario Internacional suspendiera indefinidamente el desembolso de 2.000 millones de dólares correspondiente a la primera revisión del programa de Facilidades Extendidas

Newsletter