Modelos de IA compactos: la revolución de la computación de bolsillo según investigación de Microsoft
Una reciente investigación de Microsoft ha demostrado que es posible crear modelos de inteligencia artificial (IA) lo suficientemente pequeños para funcionar en teléfonos o laptops sin comprometer su capacidad. Esta técnica abre la puerta a nuevos casos de uso para la IA y podría revolucionar la forma en que interactuamos con nuestros dispositivos.
El modelo Phi-3-mini: IA de bolsillo con capacidades similares a ChatGPT
Microsoft ha lanzado recientemente una familia de modelos de IA más pequeños, entre los que destaca Phi-3-mini. Este modelo es lo bastante compacto como para funcionar en un smartphone, pero ofrece capacidades similares a GPT-3.5, el sistema detrás de la primera versión de ChatGPT. Los investigadores de Microsoft aseguran que Phi-3-mini se compara positivamente con GPT-3.5 en pruebas estándar de IA diseñadas para evaluar el sentido común y el razonamiento.
La importancia de la selección de datos en el entrenamiento de IA
Sébastien Bubeck, investigador de Microsoft que participa en el proyecto, explica que los modelos Phi se desarrollaron para probar si ser más selectivo con lo que se entrena a un sistema de IA proporcionaría una forma de mejorar sus capacidades. En lugar de alimentar a los modelos con enormes cantidades de texto de diversas fuentes, como suelen hacer los grandes modelos de lenguaje, el equipo de Bubeck entrenó un modelo más pequeño con datos sintéticos de "calidad de libro de texto" generados por un sistema de IA mayor. Esta técnica demostró que un software de IA aparentemente poco potente puede volverse útil si se le proporciona el material adecuado.
Ventajas de los modelos de IA locales
Ejecutar modelos de IA "localmente" en un smartphone, laptop o PC reduce la latencia o las interrupciones que se producen cuando las consultas tienen que realizarse en la nube. Además, garantiza que la información permanezca en el equipo del usuario y brinda casos de uso totalmente nuevos para la IA que no se pueden llevar a cabo con el modelo centrado en la nube, como las aplicaciones profundamente integradas en el sistema operativo de un dispositivo.
El futuro de la IA: ¿modelos más grandes o más eficientes?
Los resultados de la investigación de Microsoft sugieren que, para que los próximos sistemas de IA sean más capaces, hará falta algo más que aumentar su tamaño. Los modelos a escala reducida como Phi-3 podrían ser un rasgo importante del futuro de la informática, especialmente si compañías como Apple deciden apostar por reducir la IA para que quepa en los bolsillos de sus clientes, en lugar de enfrentarse a OpenAI y Google en la construcción de modelos basados en la nube cada vez más grandes.
La investigación de Microsoft sobre modelos de IA compactos abre un nuevo horizonte en el mundo de la computación. La posibilidad de tener asistentes de IA con capacidades similares a ChatGPT en nuestros dispositivos de bolsillo, sin depender de la nube, podría transformar la forma en que interactuamos con la tecnología. Además, esta investigación sugiere que la eficiencia y la selección cuidadosa de los datos de entrenamiento podrían ser tan importantes como el tamaño de los modelos en el desarrollo de sistemas de IA más capaces en el futuro.
Te puede interesar
La inteligencia artificial y la demanda de energía: ¿la nueva crisis invisible del siglo XXI?
GPT-5.4: OpenAI lanza el primer modelo de IA que controla ordenadores de forma autónoma
Anthropic vs. Pentágono: la batalla por los límites de la IA que divide a Silicon Valley y al Congreso
Anthropic vs. Pentágono: Dario Amodei rechaza uso militar de Claude y enfrenta ultimátum
La startup de IA valorada en 380.000 millones de dólares tiene plazo hasta el viernes para ceder ante el Departamento de Defensa, que amenaza con invocar una ley de la Guerra Fría.