Tecnología 13News-Tecnología 20/06/2024

Avances en IA 2024: Claude 3.5 Sonnet de Anthropic supera a GPT-4, pero ¿dónde está el próximo gran salto?

En el vertiginoso mundo de la inteligencia artificial (IA), los avances se suceden a un ritmo frenético. Sin embargo, a medida que nos adentramos en 2024, la comunidad tecnológica y los entusiastas de la IA se preguntan: ¿dónde está el próximo gran salto revolucionario?

En el vertiginoso mundo de la inteligencia artificial (IA), los avances se suceden a un ritmo frenético. Sin embargo, a medida que nos adentramos en 2024, la comunidad tecnológica y los entusiastas de la IA se preguntan: ¿dónde está el próximo gran salto revolucionario? El reciente anuncio de Anthropic sobre su modelo Claude 3.5 Sonnet ha reavivado esta conversación, poniendo de manifiesto tanto los impresionantes avances incrementales como la creciente dificultad para lograr avances verdaderamente disruptivos en el campo de la IA.

Guillermo Francos a los Ministros: "Pongan la firma y háganse cargo de la gestión"

Claude 3.5 Sonnet: Un paso adelante, no un salto cuántico

Anthropic, una de las principales competidoras de OpenAI, ha presentado su último modelo de lenguaje, Claude 3.5 Sonnet, como una mejora significativa sobre sus predecesores y rivales. Según la compañía, este nuevo modelo supera a los mejores modelos de OpenAI, Google y Facebook en pruebas de referencia populares como GPQA, MMLU y HumanEval. Estas pruebas evalúan conocimientos de posgrado en ciencias, habilidades en múltiples disciplinas y competencia en codificación, respectivamente.

Las mejoras en Claude 3.5 Sonnet son notables:

1. Mayor habilidad para resolver problemas matemáticos, de codificación y de lógica.
2. Velocidad de procesamiento significativamente mejorada.
3. Mejor comprensión de los matices del lenguaje.
4. Capacidad mejorada para el humor y la interacción natural.

Michael Gerstenhaber, jefe de producto de Anthropic, destaca que si bien el modelo es más grande que su predecesor, gran parte de sus nuevas competencias se deben a innovaciones en el entrenamiento, como la incorporación de información específica para mejorar su razonamiento lógico.

Sin embargo, es importante señalar que estas mejoras, aunque impresionantes, representan avances incrementales más que revolucionarios. Las diferencias en rendimiento con respecto a los modelos líderes anteriores se miden en pocos puntos porcentuales, no en saltos cualitativos dramáticos.

La brecha de género en startups españolas: Desafíos y oportunidades para emprendedoras en tecnología

El contexto: Un año esperando el próximo GPT-5

Para entender la importancia del lanzamiento de Claude 3.5 Sonnet, es crucial recordar el impacto que tuvo GPT-4 de OpenAI en marzo de 2023. Este modelo marcó un antes y un después en las capacidades de la IA, demostrando una habilidad sin precedentes para chatear, codificar y resolver problemas complejos. El entrenamiento de GPT-4 costó más de 100 millones de dólares, y desde entonces, la comunidad tecnológica ha estado esperando ansiosamente su sucesor, GPT-5.

Sam Altman, CEO de OpenAI, ha alimentado las especulaciones sobre GPT-5, sugiriendo que podría representar otro salto revolucionario en las capacidades de la IA. Se espera que su desarrollo sea aún más costoso y ambicioso que el de GPT-4. Sin embargo, a medida que pasa el tiempo, la pregunta persiste: ¿dónde está ese gran salto?

Milei convoca al Pacto de Mayo en Tucumán mientras el gobernador de Santa Fe reclama obras de infraestructura

Los desafíos del progreso en IA

El caso de Claude 3.5 Sonnet ilustra algunos de los desafíos fundamentales que enfrenta la industria de la IA en su búsqueda de avances revolucionarios:

1. Escasez de datos nuevos: Con modelos como GPT-4 ya entrenados en vastas cantidades de texto, imágenes y video en línea, cada vez es más difícil encontrar nuevas fuentes de datos para alimentar los algoritmos de aprendizaje automático.

2. Costos astronómicos: Se estima que aumentar significativamente el tamaño de los modelos para mejorar su capacidad de aprendizaje podría costar miles de millones de dólares.

3. Rendimientos decrecientes: A medida que los modelos se vuelven más grandes y complejos, los beneficios marginales de aumentar su tamaño parecen disminuir.

4. Enfoque en la interfaz: Las recientes actualizaciones, como GPT-4o de OpenAI, se han centrado más en mejorar la interfaz de usuario que en aumentar dramáticamente las capacidades de resolución de problemas.

Estos desafíos sugieren que el futuro de la IA podría depender más de innovaciones inteligentes en el diseño y entrenamiento de modelos que de la simple escalada de tamaño y poder de cómputo.

OpenAI y ChatGPT: La IA que está revolucionando a gigantes como Microsoft, Apple y Google

La importancia de medir el progreso de la IA

El anuncio de Anthropic también pone de relieve la importancia y las dificultades de medir el progreso en IA. Las pruebas de referencia estándar, como las mencionadas anteriormente, tienen limitaciones significativas:

1. Sesgo de optimización: Los desarrolladores de IA están fuertemente incentivados para diseñar sus modelos de manera que obtengan altas puntuaciones en estas pruebas.

2. Contaminación de datos: Los datos utilizados en estas pruebas estandarizadas pueden haber sido incluidos en los conjuntos de entrenamiento de los modelos.

3. Inconsistencias en la evaluación: Summer Yue, director de investigación de Scale AI, señala que muchas de estas pruebas sufren de "contaminación de datos, rúbricas e informes incoherentes y experiencia no verificada de los anotadores".

Ante estas limitaciones, la industria está buscando formas más significativas de demostrar la inteligencia de sus modelos. Scale AI, por ejemplo, está desarrollando nuevas métricas a través de su Laboratorio de Seguridad, Evaluación y Alineación, que incluyen pruebas basadas en datos secretos y una evaluación más rigurosa de la experiencia de los evaluadores.

Ilya Sutskever, ex científico jefe de OpenAI, lanza Safe Superintelligence Inc. para desarrollar una IA segura

El impacto real: Más allá de las métricas

Mientras la industria lucha por encontrar mejores formas de medir el progreso, el verdadero valor de estos avances incrementales se manifiesta en sus aplicaciones prácticas. Anthropic destaca que empresas que utilizan Claude 3.5 Sonnet han encontrado beneficios tangibles en su nueva capacidad de respuesta y resolución de problemas.

Por ejemplo:
- Bridgewater Associates, una importante firma de inversiones, utiliza Claude para tareas de codificación.
- Otras empresas financieras (no reveladas) emplean el modelo para asesoramiento en inversiones.

Estos casos de uso real subrayan que, aunque los avances puedan parecer incrementales en las métricas estándar, su impacto en el mundo empresarial puede ser sustancial.

Mirando hacia el futuro

A medida que la industria de la IA continúa evolucionando, varias tendencias y expectativas emergen:

1. Innovación en entrenamiento: Es probable que veamos un mayor enfoque en técnicas innovadoras de entrenamiento en lugar de simplemente aumentar el tamaño de los modelos.

2. Especialización: Podríamos ver más modelos diseñados para exceler en tareas específicas en lugar de ser generalistas.

3. Eficiencia computacional: La búsqueda de modelos más eficientes que ofrezcan capacidades similares con menos recursos computacionales se intensificará.

4. Ética y seguridad: A medida que los modelos se vuelven más capaces, las consideraciones éticas y de seguridad ganarán aún más importancia.

5. Integración multimodal: Es probable que veamos más modelos que integren capacidades de procesamiento de texto, imagen y voz de manera fluida.

Inteligencia Artificial y Bitcoin: ¿Cómo el optimismo de Wall Street por la IA puede beneficiar a las criptomonedas?

El lanzamiento de Claude 3.5 Sonnet por Anthropic representa un avance significativo en el campo de la IA, demostrando mejoras notables en varias áreas clave. Sin embargo, también pone de manifiesto los desafíos que enfrenta la industria en su búsqueda del próximo gran salto revolucionario.

Mientras esperamos ansiosamente el lanzamiento de modelos como GPT-5, es crucial reconocer el valor de estos avances incrementales. Aunque pueden no ser tan dramáticos como los saltos cuánticos que hemos visto en el pasado, están impulsando innovaciones reales y tangibles en diversos sectores.

El futuro de la IA probablemente se caracterizará por una combinación de estos avances graduales y ocasionales saltos disruptivos. La clave estará en cómo la industria navega los desafíos de datos, costos y eficiencia, mientras continúa innovando en el diseño y entrenamiento de modelos.

En última instancia, el verdadero indicador del progreso en IA no serán las puntuaciones en pruebas de referencia, sino el impacto transformador que estos modelos tengan en la vida cotidiana y en la resolución de problemas complejos del mundo real. Mientras tanto, el mundo tecnológico sigue esperando, con una mezcla de anticipación y curiosidad, el próximo gran salto en inteligencia artificial.

Te puede interesar

xAI de Elon Musk Apuesta por Videojuegos con IA: Contrata Expertos de Nvidia y Promete Lanzamiento en 2026

La startup de inteligencia artificial de Elon Musk desarrolla "modelos mundiales" para videojuegos y robótica. Ofrece salarios de 200.000 dólares y fichó especialistas clave de Nvidia para competir contra Meta y Google

Bernie Sanders propone impuestos a los Robots ante la amenaza de IA que eliminaría 100 millones de empleos

El senador de Vermont plantea un impuesto a los robots como solución para proteger a trabajadores estadounidenses frente al avance de la inteligencia artificial y la automatización. Su informe advierte sobre una disrupción laboral sin precedentes en la próxima década que podría transformar la economía más rápido que cualquier revolución industrial anterior

OpenAI confirma mega data center de hasta u$s25.000 millones en Patagonia: Neuquén lidera la carrera por inversión récord en inteligencia artificial

La creadora de ChatGPT y Sur Energy anuncian proyecto histórico con primera etapa de u$s7.000-10.000 millones bajo RIGI. Cinco provincias compiten por la instalación que requiere energía verde, conectividad de fibra óptica y acceso a agua. Central Puerto y Genneia proveerán la energía

Trump aprueba la venta de la red social Tik Tok por 14.000 millones de dólares a consorcio

La administración estadounidense formalizó mediante orden ejecutiva la autorización para que un consorcio empresarial doméstico adquiera las operaciones de la plataforma china en territorio norteamericano

Nvidia apuesta 5.000 millones por Intel en crisis

La industria de semiconductores presenció esta semana una de las alianzas más significativas de los últimos años cuando Nvidia confirmó una inversión estratégica de 5.000 millones de dólares en Intel, marcando un punto de inflexión para el fabricante de procesadores que atraviesa su peor crisis en décadas

Microsoft rechaza derechos para la IA: "mimetismo, no conciencia"

La industria de la inteligencia artificial experimenta un debate fundamental sobre la naturaleza de los sistemas automatizados avanzados y si estos merecen algún tipo de consideración moral o protección legal

OpenAI ofrece u$d 393.000 por "estratega de contenido", nueva era salarial de la Inteligencia Artificial

La revolución de la inteligencia artificial está redefiniendo completamente el mercado laboral de contenidos digitales, transformando profesiones tradicionalmente subestimadas en posiciones estratégicas con remuneraciones extraordinarias

Gigantes tecnológicos halagan a Trump en cumbre de IA

La Casa Blanca se convirtió en epicentro de una convergencia estratégica sin precedentes entre el poder político estadounidense y los principales referentes de la industria tecnológica global

Gemini 2.5 Flash: Google desafía dominio de Photoshop

La industria del software de edición gráfica enfrenta una disrupción tecnológica significativa tras el lanzamiento oficial de Gemini 2.5 Flash, la propuesta de inteligencia artificial de Google que amenaza directamente el liderazgo histórico de Adobe Photoshop en el mercado de manipulación digital de imágenes