Tecnología 13News-Tecnología 22 de julio de 2024

OpenAI innova en seguridad de IA: Modelos que se supervisan mutuamente

OpenAI, la reconocida empresa de inteligencia artificial, ha presentado una innovadora estrategia para mejorar la transparencia y seguridad de sus modelos de IA

OpenAI, la reconocida empresa de inteligencia artificial, ha presentado una innovadora estrategia para mejorar la transparencia y seguridad de sus modelos de IA. La nueva técnica consiste en hacer que los sistemas de IA interactúen entre sí, explicándose mutuamente sus procesos de razonamiento.

Esta iniciativa, recientemente anunciada, busca arrojar luz sobre el funcionamiento interno de los modelos de IA más avanzados. La compañía planea publicar próximamente un artículo detallando esta metodología, que ha sido probada inicialmente con problemas matemáticos básicos.

En estos experimentos, se pidió a dos modelos de IA que resolvieran ecuaciones simples. El modelo más avanzado tuvo que explicar su proceso de resolución al menos sofisticado, mientras que este último intentaba identificar posibles errores en las respuestas del primero. Esta dinámica busca fomentar una mayor apertura en cuanto a los procesos de "pensamiento" de la IA.

Yining Chen, investigador de OpenAI involucrado en este proyecto, ha destacado la importancia de esta técnica para el objetivo de la empresa de desarrollar una inteligencia artificial general (AGI) que sea segura y beneficiosa para la humanidad.

Esta nueva estrategia llega en un momento crucial para OpenAI, tras experimentar cambios significativos en su equipo de seguridad. En mayo, el cofundador Ilya Sutskever anunció su salida de la empresa, seguido por Jan Leike, ambos líderes del equipo de "superalineación". Poco después, Gretchen Krueger, investigadora de políticas, también dejó la compañía, citando preocupaciones compartidas.

Estas salidas han generado inquietud en la comunidad tecnológica sobre el compromiso de OpenAI con la seguridad en el desarrollo de IA. Expertos como Elon Musk y Stuart Russell han expresado preocupaciones sobre la velocidad del avance en IA y la necesidad de validar completamente su seguridad antes de perseguir una AGI.

La nueva técnica de OpenAI podría ser una respuesta a estas preocupaciones, buscando aumentar la transparencia y comprensión de sus modelos de IA. Al hacer que los sistemas se expliquen entre sí, la empresa espera obtener insights valiosos sobre cómo estos modelos abordan y resuelven problemas.

Este enfoque no solo podría mejorar la seguridad de la IA, sino también proporcionar a los investigadores y desarrolladores una comprensión más profunda de cómo funcionan estos sistemas complejos. Además, podría ayudar a identificar y corregir posibles sesgos o errores en el razonamiento de la IA.

Sin embargo, algunos expertos advierten que esta técnica, aunque prometedora, no es una solución definitiva para todos los desafíos de seguridad en IA. Argumentan que los modelos de IA podrían perpetuar o amplificar errores entre sí, y que la supervisión humana sigue siendo crucial.

A pesar de estas advertencias, la iniciativa de OpenAI representa un paso importante hacia una mayor transparencia en el campo de la IA. Al permitir que los modelos se "vigilen" mutuamente, la empresa espera no solo mejorar la seguridad de sus sistemas, sino también ganar la confianza del público y los reguladores.

La nueva estrategia de OpenAI de hacer que los modelos de IA se supervisen entre sí marca un hito en la búsqueda de una inteligencia artificial más segura y comprensible. Aunque aún queda mucho por explorar y validar, este enfoque innovador podría abrir nuevas vías para el desarrollo responsable de la IA, equilibrando el avance tecnológico con las necesarias garantías de seguridad y ética.

Ciberseguridad Inteligencia artificial Machine learning OpenAI

Te puede interesar

OpenAI expande su imperio: las 9 industrias que Sam Altman busca revolucionar con inteligencia artificial

La compañía liderada por Altman trasciende sus orígenes como laboratorio de investigación. OpenAI compite ahora contra Google en búsquedas, desafía a Meta en redes sociales y planea fabricar chips propios. Inversiones millonarias en robótica, salud y dispositivos de consumo configuran estrategia de expansión agresiva

Eric Schmidt advierte que la IA "ya está aquí": transformará economía global en próxima década

El ex CEO de Google alertó sobre desafíos éticos, energéticos y sociales de la inteligencia artificial durante America Business Forum Miami 2025. Schmidt proyectó que cada persona tendrá "un Einstein en el bolsillo" dentro de diez años mientras centros de datos ya consumen 1% del PIB estadounidense

Disney pierde 26 millones de euros semanales por conflicto con YouTube TV: disputa por tarifas afecta transmisiones deportivas

El bloqueo de canales Disney en YouTube TV genera pérdidas de 3,7 millones de euros diarios según Morgan Stanley. La disputa mantiene ESPN y ABC fuera del servicio desde el 30 de octubre, afectando principalmente transmisiones deportivas como Monday Night Football en Estados Unidos

Bezos identifica qué trabajadores sobrevivirán a la automatización: "La IA no puede reemplazar la invención"

El fundador de Amazon defendió el valor del ingenio humano durante la Italian Tech Week 2025. Mientras su empresa acelera planes de automatización que afectarían 600.000 empleos hacia 2033, Bezos sostiene que los inventores estarán protegidos frente al avance de inteligencia artificial y robótica

Zuckerberg y Chan Apuestan Todo a Biohub: IA para Revolucionar la Investigación de Enfermedades

La fundación Chan Zuckerberg abandona educación y políticas públicas para concentrar USD 200.000 millones en biología impulsada por inteligencia artificial

CEO de Nvidia Advierte: China Puede Superar a EEUU en Inteligencia Artificial

Jensen Huang, director ejecutivo de Nvidia, intensificó sus críticas a las políticas estadounidenses sobre inteligencia artificial. Durante la cumbre del Financial Times, el CEO advirtió que el país asiático podría ganar la batalla tecnológica si Estados Unidos no cambia su estrategia regulatoria

Ir a la versión web