ChatGPT y Llama superan a los humanos en tareas de "teoría de la mente", según estudio publicado en Nature Human Behaviour
Un reciente estudio publicado en la revista científica Nature Human Behaviour ha revelado que los modelos de lenguaje de gran tamaño (LLM), como ChatGPT y Llama, pueden igualar e incluso superar a los humanos en tareas relacionadas con la "teoría de la mente"
Un reciente estudio publicado en la revista científica Nature Human Behaviour ha revelado que los modelos de lenguaje de gran tamaño (LLM), como ChatGPT y Llama, pueden igualar e incluso superar a los humanos en tareas relacionadas con la "teoría de la mente". Estas pruebas están diseñadas para evaluar la capacidad de una persona o un sistema de entender y atribuir estados mentales a otros, como creencias, deseos, intenciones, emociones y conocimientos, habilidades fundamentales para la interacción social y la comunicación efectiva.
La investigación, que comparó el desempeño de humanos y LLM en una batería de experimentos, destacó la capacidad de estos modelos de lenguaje para realizar inferencias mentales complejas. Sin embargo, también subrayó la importancia de pruebas sistemáticas para evaluar con precisión su comportamiento en comparación con la inteligencia humana.
Los investigadores utilizaron dos versiones de ChatGPT y el modelo de código abierto de Meta, Llama 2, sometiéndolos a diversas pruebas que incluían captar la ironía, interpretar solicitudes indirectas, detectar comentarios inapropiados en conversaciones y responder a preguntas con información incompleta. Al mismo tiempo, 1,907 individuos fueron sometidos a las mismas pruebas para contrastar los resultados.
A lo largo del estudio, se encontró que los modelos GPT-4 se desempeñaron a niveles humanos o incluso superiores en la identificación de solicitudes indirectas, creencias falsas y distracción, pero tuvieron dificultades para detectar errores. Por otro lado, LLaMA2 superó a los humanos únicamente en la detección de errores.
Los investigadores propusieron tres hipótesis para entender las limitaciones y comportamientos de los modelos de lenguaje en estas tareas: la hipótesis de la falla de inferencia, que sugiere que los LLM no logran entender los estados mentales porque no pueden usar información contextual externa; la hipótesis del asno de Buridán, que plantea que los modelos pueden inferir estados mentales pero no pueden decidir entre opciones igualmente probables; y la hipótesis del hiperconservadurismo, que sostiene que los LLM pueden entender y calcular estados mentales, pero evitan comprometerse con una sola opción por ser demasiado cautelosos.
Estas hipótesis ayudan a comprender mejor las fortalezas y debilidades de los LLM en tareas relacionadas con la teoría de la mente, y destacan la importancia de pruebas sistemáticas para comparar de manera no superficial las inteligencias humanas y artificiales.
El estudio se publica en un momento en que las compañías líderes en inteligencia artificial, como OpenAI y Google, están presentando versiones mejoradas de sus chatbots y asistentes de IA. La nueva versión de ChatGPT, basada en el modelo GPT-4o, es capaz de procesar información visual y auditiva, y ha demostrado una personalidad más humana, adoptando emociones y respuestas coquetas durante su presentación. Por su parte, Google mostró un prototipo más avanzado de su asistente, Project Astra, que también conversa con fluidez y comprende el mundo a través del video.
A medida que los modelos de lenguaje continúan evolucionando y mejorando sus capacidades para imitar la conducta social, las emociones y el humor humanos, será crucial seguir investigando y evaluando su desempeño en tareas complejas como la teoría de la mente. Estos avances no solo tienen implicaciones para el desarrollo de la inteligencia artificial, sino también para nuestra comprensión de la cognición humana y la interacción entre humanos y máquinas.
Te puede interesar
Trump y la Nueva Carrera Armamentística de la IA: EEUU Prepara su 'Proyecto Manhattan' Digital contra China
En un momento crucial para la hegemonía tecnológica global, Estados Unidos está considerando lanzar un ambicioso programa comparable al histórico Proyecto Manhattan, esta vez enfocado en el desarrollo de la Inteligencia Artificial General (AGI)
xAI Supera el Valor de Twitter: La Nueva Apuesta de Musk en IA Alcanza los 47.500 Millones de Euros
La empresa está próxima a cerrar una nueva ronda de financiación que ha atraído a prominentes firmas de capital riesgo, incluyendo Sequoia Capital y Andreessen Horowitz
La Era de la IA Agentica: Nvidia Rompe Récords y Revoluciona el Futuro de la Computación
En medio de una transformación tecnológica sin precedentes, Nvidia ha reportado resultados financieros extraordinarios que confirman el dominio de la compañía en la revolución de la inteligencia artificial
Carrera Armamentista Digital: EE.UU. Propone un "Plan Manhattan de la IA" para Enfrentar a China
La batalla por la supremacía tecnológica entre Estados Unidos y China alcanza un nuevo nivel con la propuesta de una comisión bipartidista del Congreso estadounidense de lanzar un programa similar al histórico Proyecto Manhattan, esta vez enfocado en el desarrollo de inteligencia artificial general (AGI)
Ceo de Nvidia, Jensen Huang, predice un salto "de un millón" en potencia computacional para 2034
El CEO de Nvidia, Jensen Huang, ha lanzado una de las predicciones más audaces en la historia de la computación: la potencia de cálculo se multiplicará por un millón en los próximos diez años
Crisis en el gigante de la IA: El nuevo superchip de Nvidia enfrenta problemas críticos de sobrecalentamiento
El futuro de la inteligencia artificial podría retrasarse debido a un inesperado obstáculo técnico. Blackwell, el revolucionario chip de Nvidia que promete duplicar la velocidad de procesamiento en IA, enfrenta serios problemas de sobrecalentamiento que han obligado a la compañía a rediseñar sus sistemas de refrigeración
El Secreto detrás del Éxito de Nvidia: Cómo la Computación Paralela Revoluciona la Era de la IA
La reciente coronación de Nvidia como la empresa más valiosa del mundo no es producto del azar. Un concepto aparentemente simple, la computación paralela, combinado con una visión estratégica del futuro tecnológico, ha catapultado a la compañía hacia la cima del mercado global, transformando radicalmente el panorama de la inteligencia artificial
Brasil Reinventa su Futuro Digital: La IA se Convierte en Aliada Ambiental
Brasil está escribiendo un nuevo capítulo en la historia de la innovación empresarial, donde la inteligencia artificial emerge como protagonista en la lucha contra el cambio climático
¿En que momento la Inteligencia Artificial alcanzará y superará la humana?
La batalla por predecir cuándo las máquinas alcanzarán la inteligencia humana divide al mundo tecnológico, generando un debate sin precedentes entre los principales arquitectos de nuestro futuro digital