Tecnología 13News-Tecnología 06/12/2025

Claude Opus 4.5 superó a todos los ingenieros humanos en el examen de codificación de Anthropic

La empresa de inteligencia artificial presentó su modelo más avanzado hasta la fecha. El sistema obtuvo mejores resultados que cualquier candidato en una evaluación técnica de dos horas diseñada para reclutar programadores

Un hito sin precedentes en programación automatizada
Anthropic acaba de marcar un antes y después en el desarrollo de inteligencia artificial aplicada a la programación. Su flamante modelo Claude Opus 4.5 logró superar a todos los aspirantes humanos que rindieron el examen técnico utilizado por la compañía para seleccionar ingenieros de software.

La evaluación consiste en una prueba domiciliaria de dos horas de duración. El objetivo es medir la capacidad técnica y el criterio profesional bajo condiciones de presión. Según explicó la empresa en su comunicado oficial, aunque el examen no abarca todas las competencias necesarias para un ingeniero, los resultados plantean interrogantes profundos sobre el futuro de esta profesión.

El rendimiento excepcional del sistema genera debates intensos en la comunidad tecnológica global. La posibilidad de que una máquina supere consistentemente a expertos humanos en tareas complejas representa un cambio de paradigma significativo.

Metodología y características de la evaluación
Anthropic reveló algunos detalles sobre cómo obtuvo estos resultados sorprendentes. El modelo recibió múltiples oportunidades para resolver cada problema planteado. Posteriormente, el sistema seleccionó su mejor respuesta entre las alternativas generadas durante el proceso.

La información pública sobre el contenido específico del examen resulta limitada. Una reseña publicada en Glassdoor durante 2024 describía una prueba estructurada en cuatro niveles distintos. Los candidatos debían implementar un sistema determinado y agregarle funcionalidades adicionales progresivamente.

La compañía no confirmó si Claude Opus 4.5 enfrentó exactamente esa misma evaluación. Tampoco respondió solicitudes periodísticas para ampliar información sobre la metodología empleada en las pruebas comparativas.

Nuevas capacidades más allá del código
El lanzamiento de Claude Opus 4.5 llega apenas tres meses después de la versión anterior. Esta velocidad de actualización refleja el ritmo acelerado de innovación que caracteriza al sector de inteligencia artificial generativa.

Además de las mejoras en programación, el nuevo modelo presenta avances significativos en otras áreas profesionales. La generación de documentos corporativos experimentó optimizaciones notables. El sistema produce hojas de cálculo en formato Excel con mayor precisión y coherencia.

Las presentaciones en PowerPoint también mejoraron sustancialmente respecto a versiones anteriores. Estas capacidades amplían el espectro de aplicaciones prácticas para usuarios empresariales y profesionales independientes.

Anthropic consolida su liderazgo en codificación con IA
La startup fundada por exintegrantes de OpenAI refuerza su posición dominante en el segmento de programación asistida. Los competidores enfrentan dificultades crecientes para igualar el rendimiento demostrado por los modelos Claude en tareas de desarrollo de software.

Un dato revelador ilustra esta supremacía tecnológica. Meta, la empresa matriz de Facebook e Instagram, utiliza Claude para potenciar su asistente interno de codificación denominado Devmate. Esta decisión resulta llamativa considerando que ambas compañías compiten directamente en la carrera por liderar el mercado de inteligencia artificial.

La estrategia de entrenamiento empleada por Anthropic permanece en secreto. Sin embargo, fuentes de la industria aportaron algunas pistas sobre los métodos utilizados por la empresa californiana.

El misterio detrás del entrenamiento
Eric Simons, director ejecutivo de Stackblitz, compartió su teoría sobre las técnicas de Anthropic. Según el empresario responsable del servicio Bolt.new, la compañía habría entrenado sus modelos permitiéndoles escribir y ejecutar código de manera autónoma.

Posteriormente, tanto revisores humanos como herramientas automatizadas evaluaron los resultados generados. Dianne Penn, directiva de Anthropic especializada en investigación y gestión de productos, confirmó que esta descripción resulta "en general verídica".

Este enfoque de aprendizaje supervisado combinado con iteración autónoma explicaría parcialmente el rendimiento superior alcanzado. La retroalimentación constante entre generación y evaluación perfecciona progresivamente las capacidades del sistema.

Impacto en el mercado laboral tecnológico
Dario Amodei, máximo ejecutivo de Anthropic, ofreció declaraciones esclarecedoras durante la conferencia Dreamforce de octubre. El empresario reveló que Claude redacta aproximadamente el noventa por ciento del código producido en la mayoría de los equipos internos de la empresa.

Sin embargo, Amodei descartó enfáticamente que planeen reemplazar programadores humanos por sistemas automatizados. Su visión apunta hacia una transformación cualitativa de las funciones profesionales.

Los ingenieros podrían concentrarse en el diez por ciento restante del trabajo. Ese porcentaje incluye tareas de edición, supervisión y resolución de problemas complejos que requieren criterio humano especializado.

Perspectivas para el futuro de la ingeniería
El directivo argumentó que la productividad aumentada no implica necesariamente reducción de plantillas laborales. Por el contrario, las organizaciones podrían requerir igual o mayor cantidad de profesionales técnicos.

La diferencia radicaría en el tipo de actividades realizadas por estos trabajadores. Supervisar grupos de modelos de inteligencia artificial demandaría habilidades específicas distintas a la codificación tradicional.

El panorama sugiere una reconfiguración profunda de competencias valoradas en el mercado tecnológico. La capacidad para dirigir y auditar sistemas automatizados ganaría relevancia frente al dominio técnico puro.

Qué esperar en los próximos meses
Anthropic demostró capacidad para iterar rápidamente sobre sus desarrollos previos. El intervalo de apenas noventa días entre versiones mayores anticipa actualizaciones frecuentes durante 2026.

La competencia con OpenAI, Google y Meta intensificará la presión por nuevos avances. Cada lanzamiento eleva las expectativas sobre rendimiento y funcionalidades adicionales.

El debate sobre las implicaciones laborales y éticas de estos sistemas continuará expandiéndose. Reguladores, empresas y trabajadores deberán adaptarse a una realidad tecnológica que evoluciona más rápido que los marcos normativos existentes.

AGI AI Anthropic ChatGPT IA Inteligencia artificial OpenAI Tecno Tecnología

Te puede interesar

La inteligencia artificial y la demanda de energía: ¿la nueva crisis invisible del siglo XXI?

Los centros de datos podrían concentrar hasta el 8% del consumo eléctrico mundial en 2040. La IA promete optimizar recursos, pero su expansión sin regulación energética es el desafío estructural del siglo.

GPT-5.4: OpenAI lanza el primer modelo de IA que controla ordenadores de forma autónoma

El nuevo sistema integra razonamiento avanzado, codificación y agentes autónomos con capacidad para ejecutar flujos de trabajo complejos sin intervención humana, con un contexto de un millón de tokens.

Anthropic vs. Pentágono: la batalla por los límites de la IA que divide a Silicon Valley y al Congreso

OpenAI admitió que su acuerdo con el Departamento de Defensa fue "oportunista", mientras demócratas prometen legislación para proteger a empresas que marquen límites éticos al uso militar de la inteligencia artificial.

Anthropic vs. Pentágono: Dario Amodei rechaza uso militar de Claude y enfrenta ultimátum

La startup de IA valorada en 380.000 millones de dólares tiene plazo hasta el viernes para ceder ante el Departamento de Defensa, que amenaza con invocar una ley de la Guerra Fría.

Agentes de IA Sin Controles de Seguridad: El Riesgo Sistémico que la Industria Tecnológica No Quiere Mostrar

Un estudio de Cambridge, MIT y Stanford revela que solo 4 de 30 agentes de IA líderes publican documentos formales de seguridad. La autonomía crece. La transparencia, no. Las implicancias para empresas, inversores y usuarios son más graves de lo que el sector reconoce.

Guerra de titanes IA: OpenAI busca u$s100.000 millones y Anthropic vale u$s380.000 millones; la carrera que redefine el capitalismo tecnológico global

Dos rondas de financiación históricas en el mismo mes configuran un nuevo paradigma de concentración de capital en inteligencia artificial. Amazon, SoftBank, Nvidia y Microsoft apuestan cifras sin precedentes mientras surgen interrogantes sobre la sostenibilidad estructural del modelo.

Ir a la versión web