Claude Opus 4.5 superó a todos los ingenieros humanos en el examen de codificación de Anthropic


La Newsletter de Gustavo Reija - Economista y CEO de NETIA GROUP
4 informes exclusivos cada mes, con el análisis de las tendencias macroeconómicas y políticas con perspectivas sobre mercados financieros y su impacto en la industria. Recomendaciones estratégicas para inversores y empresarios.
Suscripción con MERCADOPAGO
Un hito sin precedentes en programación automatizada
Anthropic acaba de marcar un antes y después en el desarrollo de inteligencia artificial aplicada a la programación. Su flamante modelo Claude Opus 4.5 logró superar a todos los aspirantes humanos que rindieron el examen técnico utilizado por la compañía para seleccionar ingenieros de software.
La evaluación consiste en una prueba domiciliaria de dos horas de duración. El objetivo es medir la capacidad técnica y el criterio profesional bajo condiciones de presión. Según explicó la empresa en su comunicado oficial, aunque el examen no abarca todas las competencias necesarias para un ingeniero, los resultados plantean interrogantes profundos sobre el futuro de esta profesión.
El rendimiento excepcional del sistema genera debates intensos en la comunidad tecnológica global. La posibilidad de que una máquina supere consistentemente a expertos humanos en tareas complejas representa un cambio de paradigma significativo.

Metodología y características de la evaluación
Anthropic reveló algunos detalles sobre cómo obtuvo estos resultados sorprendentes. El modelo recibió múltiples oportunidades para resolver cada problema planteado. Posteriormente, el sistema seleccionó su mejor respuesta entre las alternativas generadas durante el proceso.
La información pública sobre el contenido específico del examen resulta limitada. Una reseña publicada en Glassdoor durante 2024 describía una prueba estructurada en cuatro niveles distintos. Los candidatos debían implementar un sistema determinado y agregarle funcionalidades adicionales progresivamente.
La compañía no confirmó si Claude Opus 4.5 enfrentó exactamente esa misma evaluación. Tampoco respondió solicitudes periodísticas para ampliar información sobre la metodología empleada en las pruebas comparativas.
Nuevas capacidades más allá del código
El lanzamiento de Claude Opus 4.5 llega apenas tres meses después de la versión anterior. Esta velocidad de actualización refleja el ritmo acelerado de innovación que caracteriza al sector de inteligencia artificial generativa.
Además de las mejoras en programación, el nuevo modelo presenta avances significativos en otras áreas profesionales. La generación de documentos corporativos experimentó optimizaciones notables. El sistema produce hojas de cálculo en formato Excel con mayor precisión y coherencia.
Las presentaciones en PowerPoint también mejoraron sustancialmente respecto a versiones anteriores. Estas capacidades amplían el espectro de aplicaciones prácticas para usuarios empresariales y profesionales independientes.
Anthropic consolida su liderazgo en codificación con IA
La startup fundada por exintegrantes de OpenAI refuerza su posición dominante en el segmento de programación asistida. Los competidores enfrentan dificultades crecientes para igualar el rendimiento demostrado por los modelos Claude en tareas de desarrollo de software.
Un dato revelador ilustra esta supremacía tecnológica. Meta, la empresa matriz de Facebook e Instagram, utiliza Claude para potenciar su asistente interno de codificación denominado Devmate. Esta decisión resulta llamativa considerando que ambas compañías compiten directamente en la carrera por liderar el mercado de inteligencia artificial.
La estrategia de entrenamiento empleada por Anthropic permanece en secreto. Sin embargo, fuentes de la industria aportaron algunas pistas sobre los métodos utilizados por la empresa californiana.
El misterio detrás del entrenamiento
Eric Simons, director ejecutivo de Stackblitz, compartió su teoría sobre las técnicas de Anthropic. Según el empresario responsable del servicio Bolt.new, la compañía habría entrenado sus modelos permitiéndoles escribir y ejecutar código de manera autónoma.
Posteriormente, tanto revisores humanos como herramientas automatizadas evaluaron los resultados generados. Dianne Penn, directiva de Anthropic especializada en investigación y gestión de productos, confirmó que esta descripción resulta "en general verídica".
Este enfoque de aprendizaje supervisado combinado con iteración autónoma explicaría parcialmente el rendimiento superior alcanzado. La retroalimentación constante entre generación y evaluación perfecciona progresivamente las capacidades del sistema.
Impacto en el mercado laboral tecnológico
Dario Amodei, máximo ejecutivo de Anthropic, ofreció declaraciones esclarecedoras durante la conferencia Dreamforce de octubre. El empresario reveló que Claude redacta aproximadamente el noventa por ciento del código producido en la mayoría de los equipos internos de la empresa.
Sin embargo, Amodei descartó enfáticamente que planeen reemplazar programadores humanos por sistemas automatizados. Su visión apunta hacia una transformación cualitativa de las funciones profesionales.
Los ingenieros podrían concentrarse en el diez por ciento restante del trabajo. Ese porcentaje incluye tareas de edición, supervisión y resolución de problemas complejos que requieren criterio humano especializado.
Perspectivas para el futuro de la ingeniería
El directivo argumentó que la productividad aumentada no implica necesariamente reducción de plantillas laborales. Por el contrario, las organizaciones podrían requerir igual o mayor cantidad de profesionales técnicos.
La diferencia radicaría en el tipo de actividades realizadas por estos trabajadores. Supervisar grupos de modelos de inteligencia artificial demandaría habilidades específicas distintas a la codificación tradicional.
El panorama sugiere una reconfiguración profunda de competencias valoradas en el mercado tecnológico. La capacidad para dirigir y auditar sistemas automatizados ganaría relevancia frente al dominio técnico puro.
Qué esperar en los próximos meses
Anthropic demostró capacidad para iterar rápidamente sobre sus desarrollos previos. El intervalo de apenas noventa días entre versiones mayores anticipa actualizaciones frecuentes durante 2026.
La competencia con OpenAI, Google y Meta intensificará la presión por nuevos avances. Cada lanzamiento eleva las expectativas sobre rendimiento y funcionalidades adicionales.
El debate sobre las implicaciones laborales y éticas de estos sistemas continuará expandiéndose. Reguladores, empresas y trabajadores deberán adaptarse a una realidad tecnológica que evoluciona más rápido que los marcos normativos existentes.
GPT-5.4: OpenAI lanza el primer modelo de IA que controla ordenadores de forma autónoma
Anthropic vs. Pentágono: la batalla por los límites de la IA que divide a Silicon Valley y al Congreso
Anthropic vs. Pentágono: Dario Amodei rechaza uso militar de Claude y enfrenta ultimátum
La startup de IA valorada en 380.000 millones de dólares tiene plazo hasta el viernes para ceder ante el Departamento de Defensa, que amenaza con invocar una ley de la Guerra Fría.
Agentes de IA Sin Controles de Seguridad: El Riesgo Sistémico que la Industria Tecnológica No Quiere Mostrar
Guerra de titanes IA: OpenAI busca u$s100.000 millones y Anthropic vale u$s380.000 millones; la carrera que redefine el capitalismo tecnológico global
El derrame que nunca llegará: importan una ciudad china entera y a las pymes argentinas ni las dejaron competir
Economía en K: el país que crece para unos pocos y se rompe para la mayoría
La madre de todas las industrias trabaja a media máquina: la metalurgia perforó el piso de la pandemia



