13NewsesUser-agent: * Allow: / User-agent: Googlebot-News Allow: /

La Realidad, lo más increíble que tenemos

ChatGPT y Llama superan a los humanos en tareas de "teoría de la mente", según estudio publicado en Nature Human Behaviour

Un reciente estudio publicado en la revista científica Nature Human Behaviour ha revelado que los modelos de lenguaje de gran tamaño (LLM), como ChatGPT y Llama, pueden igualar e incluso superar a los humanos en tareas relacionadas con la "teoría de la mente"
Tecnología22/05/2024 13News-Tecnología

La Newsletter de Gustavo Reija - Economista y CEO de NETIA GROUP

4 informes exclusivos cada mes, con el análisis de las tendencias macroeconómicas y políticas con perspectivas sobre mercados financieros y su impacto en la industria. Recomendaciones estratégicas para inversores y empresarios.

 Suscripción con MERCADOPAGO


 

Un reciente estudio publicado en la revista científica Nature Human Behaviour ha revelado que los modelos de lenguaje de gran tamaño (LLM), como ChatGPT y Llama, pueden igualar e incluso superar a los humanos en tareas relacionadas con la "teoría de la mente". Estas pruebas están diseñadas para evaluar la capacidad de una persona o un sistema de entender y atribuir estados mentales a otros, como creencias, deseos, intenciones, emociones y conocimientos, habilidades fundamentales para la interacción social y la comunicación efectiva.

La investigación, que comparó el desempeño de humanos y LLM en una batería de experimentos, destacó la capacidad de estos modelos de lenguaje para realizar inferencias mentales complejas. Sin embargo, también subrayó la importancia de pruebas sistemáticas para evaluar con precisión su comportamiento en comparación con la inteligencia humana.

th?id=OIPETF de Ether Podrían Catapultar el Precio de ETH a $10,000: Expertos Analizan el Impacto y el Calendario de Aprobación

Los investigadores utilizaron dos versiones de ChatGPT y el modelo de código abierto de Meta, Llama 2, sometiéndolos a diversas pruebas que incluían captar la ironía, interpretar solicitudes indirectas, detectar comentarios inapropiados en conversaciones y responder a preguntas con información incompleta. Al mismo tiempo, 1,907 individuos fueron sometidos a las mismas pruebas para contrastar los resultados.

A lo largo del estudio, se encontró que los modelos GPT-4 se desempeñaron a niveles humanos o incluso superiores en la identificación de solicitudes indirectas, creencias falsas y distracción, pero tuvieron dificultades para detectar errores. Por otro lado, LLaMA2 superó a los humanos únicamente en la detección de errores.

th?id=OIFMicrosoft se prepara para revolucionar la IA en la conferencia Build 2024

Los investigadores propusieron tres hipótesis para entender las limitaciones y comportamientos de los modelos de lenguaje en estas tareas: la hipótesis de la falla de inferencia, que sugiere que los LLM no logran entender los estados mentales porque no pueden usar información contextual externa; la hipótesis del asno de Buridán, que plantea que los modelos pueden inferir estados mentales pero no pueden decidir entre opciones igualmente probables; y la hipótesis del hiperconservadurismo, que sostiene que los LLM pueden entender y calcular estados mentales, pero evitan comprometerse con una sola opción por ser demasiado cautelosos.

Estas hipótesis ayudan a comprender mejor las fortalezas y debilidades de los LLM en tareas relacionadas con la teoría de la mente, y destacan la importancia de pruebas sistemáticas para comparar de manera no superficial las inteligencias humanas y artificiales.

sameer-samat-headshot-2.0.1499504809.0La IA cambiará los smartphones y redefinirá la batalla entre Google y Apple, según el responsable de Android

El estudio se publica en un momento en que las compañías líderes en inteligencia artificial, como OpenAI y Google, están presentando versiones mejoradas de sus chatbots y asistentes de IA. La nueva versión de ChatGPT, basada en el modelo GPT-4o, es capaz de procesar información visual y auditiva, y ha demostrado una personalidad más humana, adoptando emociones y respuestas coquetas durante su presentación. Por su parte, Google mostró un prototipo más avanzado de su asistente, Project Astra, que también conversa con fluidez y comprende el mundo a través del video.

A medida que los modelos de lenguaje continúan evolucionando y mejorando sus capacidades para imitar la conducta social, las emociones y el humor humanos, será crucial seguir investigando y evaluando su desempeño en tareas complejas como la teoría de la mente. Estos avances no solo tienen implicaciones para el desarrollo de la inteligencia artificial, sino también para nuestra comprensión de la cognición humana y la interacción entre humanos y máquinas.

Claves
OIP

Argentina Se Encareció 28,5% en Dólares Libres en 12 Meses: El Dato Exacto que Demuestra que la Estabilización Sin Desarrollo es Solo la Antesala del Próximo Colapso Cambiario

Gustavo Rodolfo Reija-Ceo Netia Group SAS
Economía02/04/2026
 Blue $1.300 el 31 de marzo de 2025. Blue $1.405 el 31 de marzo de 2026. Inflación acumulada estimada en 36,6% — con el consenso de consultoras privadas proyectando 3,2% para marzo. La aritmética es implacable: 28,5% de encarecimiento en dólares libres en exactamente doce meses. No es una proyección ni un modelo econométrico. Es la diferencia entre dos cierres de mercado y el IPC del INDEC. Y ese número documenta con precisión milimétrica por qué los ciclos de ancla cambiaria sin transformación productiva terminan siempre de la misma manera en Argentina.
Te puede interesar
OIP

Guerra de titanes IA: OpenAI busca u$s100.000 millones y Anthropic vale u$s380.000 millones; la carrera que redefine el capitalismo tecnológico global

Rocío Reija-Directora Marketing Digital
Tecnología19/02/2026
Dos rondas de financiación históricas en el mismo mes configuran un nuevo paradigma de concentración de capital en inteligencia artificial. Amazon, SoftBank, Nvidia y Microsoft apuestan cifras sin precedentes mientras surgen interrogantes sobre la sostenibilidad estructural del modelo.
Lo más visto
OIP

Fallo YPF: Milei festeja una victoria judicial que le da la razón a Kicillof y contradice dos años de su propio relato

Redacción 13News
Economía27/03/2026
La Cámara de Apelaciones del Segundo Circuito de Nueva York anuló la condena de USD 16.100 millones contra el Estado argentino por la expropiación de YPF en 2012. El fallo reconoce que la nacionalización se ajustó al ordenamiento jurídico argentino y al Congreso Nacional. La contradicción es estructural: el gobierno que durante dos años acusó a Kicillof de haber generado el mayor juicio de la historia argentina celebra ahora una sentencia que valida exactamente los argumentos jurídicos que Kicillof sostuvo desde el primer día.
tecnicas-de-venta-para-supermercados

Inflación de marzo 2026: diez meses sin desacelerar, naftas como variable exógena y el alivio en alimentos que no alcanza para cambiar el diagnóstico estructural

Redacción 13News
Economía30/03/2026
Las estimaciones privadas ubican la inflación de marzo entre 2,8% y 3,1%, con deflación en alimentos en la segunda quincena pero presión sostenida de combustibles, regulados y servicios. El programa acumula un trimestre con inflación en torno al 9% y enfrenta un segundo trimestre donde la consistencia monetaria choca con una estructura de costos que la política de encajes no puede desactivar.
OIP

La motosierra bajó el déficit a cero. El riesgo país sigue en 634 puntos. Uruguay nunca tuvo motosierra y opera en 86.

Redacción 13News
Economía31/03/2026
Argentina eliminó el déficit fiscal, comprimió la base monetaria y acumuló reservas por USD 3.500 millones en el primer trimestre. El EMBI cerró marzo en 634 puntos básicos. Uruguay nunca aplicó ajuste de shock, nunca tuvo cepo cambiario y opera en 86 puntos. La diferencia de 548 puntos no la genera el déficit que Argentina ya no tiene: la generan cinco defaults en un siglo, USD 30.000 millones de vencimientos acumulados hacia 2027, reservas netas insuficientes y una estructura exportadora sin complejidad tecnológica creciente. Lo que la motosierra corta es el flujo. El stock de desconfianza estructural tiene otra herramienta. Que todavía no existe.
OIP

El Mercado Le Puso Fecha de Vencimiento al Modelo: 14% de Tasa Para Después de 2027 es la Señal que Argentina No Puede Ignorar

Gustavo Rodolfo Reija-Ceo Netia Group SAS
Economía01/04/2026
La última licitación de deuda soberana en dólares produjo un diferencial de 348 puntos básicos entre instrumentos separados por apenas doce meses de plazo: 5,02% anual para vencimiento pre-electoral versus 8,50% para post-2027, con tasa forward implícita de 14,09%. La lectura técnica es inequívoca: el mercado no está descontando riesgo político opositor — está incorporando la probabilidad de que un modelo de estabilización sin desarrollo productivo, sin política industrial activa y con superávit fiscal que no computa íntegramente el devengamiento de intereses capitalizables, no sea autosostenible más allá del ciclo electoral. La experiencia de Corea del Sur, Alemania e Irlanda demuestra que hay salida. Pero tiene requisitos que Argentina todavía no cumple.
OIP

Argentina Se Encareció 28,5% en Dólares Libres en 12 Meses: El Dato Exacto que Demuestra que la Estabilización Sin Desarrollo es Solo la Antesala del Próximo Colapso Cambiario

Gustavo Rodolfo Reija-Ceo Netia Group SAS
Economía02/04/2026
 Blue $1.300 el 31 de marzo de 2025. Blue $1.405 el 31 de marzo de 2026. Inflación acumulada estimada en 36,6% — con el consenso de consultoras privadas proyectando 3,2% para marzo. La aritmética es implacable: 28,5% de encarecimiento en dólares libres en exactamente doce meses. No es una proyección ni un modelo econométrico. Es la diferencia entre dos cierres de mercado y el IPC del INDEC. Y ese número documenta con precisión milimétrica por qué los ciclos de ancla cambiaria sin transformación productiva terminan siempre de la misma manera en Argentina.
Suscríbete al newsletter para recibir periódicamente las novedades en tu email
13NewsesUser-agent: * Allow: / User-agent: Googlebot-News Allow: /