La tecnológica estadounidense Microsoft anunció la eliminación de aproximadamente 9000 puestos laborales, convirtiéndose en la tercera iniciativa de reducción de personal que implementa la compañía durante 2025
¿Qué es overfitting y underfitting? ¿y cómo solucionarlo?
Las principales causas al obtener malos resultados en Machine Learning son el overfitting o el underfitting de los datos. Cuando entrenamos nuestro modelo intentamos “hacer encajar” -fit en inglés- los datos de entrada entre ellos y con la salida
Tecnología09/05/2024 IGNACIO MANUEL FERNANDEZ

Las principales causas al obtener malos resultados en Machine Learning son el overfitting o el underfitting de los datos. Cuando entrenamos nuestro modelo intentamos “hacer encajar” -fit en inglés- los datos de entrada entre ellos y con la salida. Tal vez se pueda traducir overfitting como “sobreajuste” y underfitting como “subajuste” y hacen referencia al fallo de nuestro modelo al generalizar -encajar- el conocimiento que pretendemos que adquieran. Lo explicaremos a continuación con un ejemplo.

Generalización del Conocimiento
Como si se tratase de un ser humano, las máquinas de aprendizaje deberán ser capaces de generalizar conceptos. Supongamos que vemos un perro Labrador por primera vez en la vida y nos dicen “eso es un perro”. Luego nos enseñan un Caniche y nos preguntan: ¿eso es un perro? Diremos “No”, pues no se parece en nada a lo que aprendimos anteriormente. Ahora imaginemos que nuestro tutor nos muestra un libro con fotos de 10 razas de perros distintas. Cuando veamos una raza de perro que desconocíamos seguramente seremos capaces de reconocer al cuadrúpedo canino al tiempo de poder discernir en que un gato no es un perro, aunque sea peludo y tenga 4 patas.
Cuando entrenamos nuestros modelos computacionales con un conjunto de datos de entrada estamos haciendo que el algoritmo sea capaz de generalizar un concepto para que al consultarle por un nuevo conjunto de datos desconocido éste sea capaz de sintetizarlo, comprenderlo y devolvernos un resultado fiable dada su capacidad de generalización.
El problema de la Máquina al Generalizar
Si nuestros datos de entrenamiento son muy pocos nuestra máquina no será capaz de generalizar el conocimiento y estará incurriendo en underfitting. Este es el caso en el que le enseñamos sólo una raza de perros y pretendemos que pueda reconocer a otras 10 razas de perros distintas. El algoritmo no será capaz de darnos un resultado bueno por falta de “materia prima” para hacer sólido su conocimiento. También es ejemplo de “subajuste” cuando la máquina reconoce todo lo que “ve” como un perro, tanto una foto de un gato o un coche.
Por el contrario, si entrenamos a nuestra máquina con 10 razas de perros sólo de color marrón de manera rigurosa y luego enseñamos una foto de un perro blanco, nuestro modelo no podrá reconocerlo cómo perro por no cumplir exactamente con las características que aprendió (el color forzosamente debía ser marrón). Aquí se trata de un problema de overfitting.
Tanto el problema del ajuste “por debajo” como “por encima” de los datos son malos porque no permiten que nuestra máquina generalice el conocimiento y no nos darán buenas predicciones (o clasificación, o agrupación, etc.)
Overfitting en Machine Learning
Es muy común que al comenzar a aprender machine learning caigamos en el problema del Overfitting. Lo que ocurrirá es que nuestra máquina sólo se ajustará a aprender los casos particulares que le enseñamos y será incapaz de reconocer nuevos datos de entrada. En nuestro conjunto de datos de entrada muchas veces introducimos muestras atípicas (ó anomalas) o con “ruido/distorción” en alguna de sus dimensiones, o muestras que pueden no ser del todo representativas. Cuando “sobre-entrenamos” nuestro modelo y caemos en el overfitting, nuestro algoritmo estará considerando como válidos sólo los datos idénticos a los de nuestro conjunto de entrenamiento –incluidos sus defectos– y siendo incapaz de distinguir entradas buenas como fiables si se salen un poco de los rangos ya prestablecidos.
El equilibrio del Aprendizaje
Deberemos encontrar un punto medio en el aprendizaje de nuestro modelo en el que no estemos incurriendo en underfitting y tampoco en overfitting. A veces esto puede resultar una tarea muy difícil.
Para reconocer este problema deberemos subdividir nuestro conjunto de datos de entrada para entrenamiento en dos: uno para entrenamiento y otro para la Test que el modelo no conocerá de antemano. Esta división se suele hacer del 80% para entrenar y 20%. El conjunto de Test deberá tener muestras diversas en lo posible y una cantidad de muestras suficiente para poder comprobar los resultados una vez entrenado el modelo.
Cuando entrenamos nuestro modelo solemos parametrizar y limitar el algoritmo, por ejemplo la cantidad de iteraciones que tendrá o un valor de “tasa de aprendizaje” (learning-rate) por iteración y muchos otros. Para lograr que nuestro modelo dé buenos resultados iremos revisando y contrastando nuestro entrenamiento con el conjunto de Test y su tasa de errores, utilizando más o menos iteraciones, etc. hasta dar con buenas predicciones y sin tener los problemas de over-under-fitting.
Prevenir el Sobreajuste de datos
Para intentar que estos problemas nos afecten lo menos posible, podemos llevar a cabo diversas acciones.
· Cantidad mínima de muestras tanto para entrenar el modelo como para validarlo.
· Clases variadas y equilibradas en cantidad: En caso de aprendizaje supervisado y suponiendo que tenemos que clasificar diversas clases o categorías, es importante que los datos de entrenamiento estén balanceados. Supongamos que tenemos que diferenciar entre manzanas, peras y bananas, debemos tener muchas fotos de las 3 frutas y en cantidades similares. Si tenemos muy pocas fotos de peras, esto afectará en el aprendizaje de nuestro algoritmo para identificar esa fruta.
· Conjunto de Test de datos. Siempre subdividir nuestro conjunto de datos y mantener una porción del mismo “oculto” a nuestra máquina entrenada. Esto nos permitirá obtener una valoración de aciertos/fallos real del modelo y también nos permitirá detectar fácilmente efectos del overfitting /underfitting.
· Parameter Tunning o Ajuste de Parámetros: deberemos experimentar sobre todo dando más/menos “tiempo/iteraciones” al entrenamiento y su aprendizaje hasta encontrar el equilibrio.
· Cantidad excesiva de Dimensiones (features), con muchas variantes distintas, sin suficientes muestras. A veces conviene eliminar o reducir la cantidad de características que utilizaremos para entrenar el modelo. Una herramienta útil para hacerlo es PCA.
· Quiero notar que si nuestro modelo es una red neuronal artificial –deep learning-, podemos caer en overfitting si usamos capas ocultas en exceso, ya que haríamos que el modelo memorice las posibles salidas, en vez de ser flexible y adecuar las activaciones a las entradas nuevas.
Si el modelo entrenado con el conjunto de train tiene un 90% de aciertos y con el conjunto de test tiene un porcentaje muy bajo, esto señala claramente un problema de overfitting.
Si en el conjunto de Test sólo se acierta un tipo de clase (por ejemplo “peras”) o el único resultado que se obtiene es siempre el mismo valor será que se produjo un problema de underfitting.
En Resumen
Siempre que creamos una máquina de aprendizaje deberemos tener en cuenta que pueden caer en uno de estos problemas por no poder generalizar correctamente el conocimiento. Underfitting indicará la imposibilidad de identificar o de obtener resultados correctos por carecer de suficientes muestras de entrenamiento o un entrenamiento muy pobre. Overfitting indicará un aprendizaje “excesivo” del conjunto de datos de entrenamiento haciendo que nuestro modelo únicamente pueda producir unos resultados singulares y con la imposibilidad de comprender nuevos datos de entrada.
Ignacio Manuel Fernandez - Business Analyst Prisma Medios de Pago

¿Qué son los Modelos mundo?: la apuesta tecnológica para superar nuevos límites en desarrollo de Inteligencia Artificial
La carrera por dominar la inteligencia artificial ha tomado un giro inesperado. Mientras OpenAI y Anthropic continúan perfeccionando sus sistemas conversacionales, un selecto grupo de investigadores ha puesto sus miras en una tecnología radicalmente diferente que promete revolucionar nuestra comprensión de la IA
SoftBank y TSMC negocian megaproyecto de IA en EEUU por 1 billón de dólares
La industria tecnológica global presencia una de las propuestas más ambiciosas de la década cuando el magnate japonés Masayoshi Son presenta su visión para revolucionar la manufactura estadounidense de inteligencia artificial

¿Por qué WhatsApp es el campo batalla IA entre Meta y sus rivales?
La plataforma de mensajería instantánea más utilizada globalmente experimenta una transformación inesperada al convertirse en el escenario principal donde asistentes virtuales de inteligencia artificial compiten por la atención de usuarios, creando una paradoja estratégica para Meta que debe enfrentar la presencia de competidores directos dentro de su propio ecosistema

El Juego de Tronos de la Inteligencia Artificial: Génesis de una nueva era
Dentro de unas décadas, los libros de historia contarán esta gesta como una de las más determinantes de nuestro tiempo

Microsoft evalúa romper acuerdo con OpenAI por conflicto accionario
La corporación de Redmond considera mantener el contrato vigente si las negociaciones sobre la transformación empresarial de la creadora de ChatGPT no prosperan según sus expectativas

¿Qué relación hay entre la IA y la Paternidad? CEO tecnológico decide retrasar su paternidad hasta que Neuralink esté listo
El joven ejecutivo tecnológico Alexandr Wang ha tomado una decisión que refleja el nivel de confianza depositado por la nueva generación de empresarios en las interfaces cerebro-computador

Fabricante autos eléctricos BYD desestabiliza mercado chino con guerra de precios
Las autoridades chinas enfrentan un escenario sin precedentes en su sector automotriz tras las agresivas estrategias comerciales implementadas por BYD, el fabricante de vehículos eléctricos que ha desencadenado una espiral deflacionaria que amenaza la estabilidad de toda la industria

La carrera tecnológica por dominar la inteligencia artificial revela disparidades fundamentales entre los gigantes de Silicon Valley

¿Qué son los Modelos mundo?: la apuesta tecnológica para superar nuevos límites en desarrollo de Inteligencia Artificial
La carrera por dominar la inteligencia artificial ha tomado un giro inesperado. Mientras OpenAI y Anthropic continúan perfeccionando sus sistemas conversacionales, un selecto grupo de investigadores ha puesto sus miras en una tecnología radicalmente diferente que promete revolucionar nuestra comprensión de la IA

Jueza Preska ordena entregar el 51% de las acciones de YPF a demandantes del juicio por nacionalización
La magistrada Loretta Preska determinó que el Estado argentino debe transferir su participación mayoritaria en YPF a los demandantes del litigio originado por la controversida nacionalización ejecutada hace más de una década
Ola de frío y crísis energética: 100.000 usuarios sin luz y estaciones de servicio sin GNC
La ola polar que azotó Argentina durante esta semana desencadenó una crisis energética sin precedentes que dejó al descubierto las profundas vulnerabilidades de un sistema que arrastra décadas de deterioro estructural
La tecnológica estadounidense Microsoft anunció la eliminación de aproximadamente 9000 puestos laborales, convirtiéndose en la tercera iniciativa de reducción de personal que implementa la compañía durante 2025
:quality(85)/assets.iprofesional.com/assets/jpg/2024/12/588649_landscape.jpg)
Analistas prevén volatilidad en valor del Dólar en segundo semestre electoral
La divisa estadounidense experimentó una escalada significativa durante la primera semana de julio, acumulando un incremento de 40 pesos que la posicionó en los registros más elevados desde la eliminación del cepo cambiario

¿Hacía dónde va el mercado en EEUU? Grandes Inversores venden mientras BlackRock compra
El panorama financiero global presenta una dualidad intrigante que ha captado la atención de analistas especializados en los mercados internacionales
Milei exige libertad comercial al Mercosur o amenaza con flexibilizar vínculos
El presidente argentino Javier Milei planteó una disyuntiva fundamental durante la cumbre del Mercosur realizada en Buenos Aires: el bloque regional debe avanzar hacia una apertura comercial significativa o Argentina evaluará modificar las condiciones de su participación en la alianza
J.P. Morgan cierra Carry Trade en Argentina con 10,4% de ganancia en dólares en 73 días
El gigante financiero estadounidense J.P. Morgan materializó una rentabilidad excepcional del 10,4% en dólares durante una operación de carry trade ejecutada en el mercado argentino a lo largo de 73 días

FMI revisa programa argentino y no fija fecha para desembolsar los USD 2.000 millones del acuerdo, por incumplimiento en acumulación de reservas
La administración de Javier Milei enfrenta una encrucijada financiera después de que el Fondo Monetario Internacional suspendiera indefinidamente el desembolso de 2.000 millones de dólares correspondiente a la primera revisión del programa de Facilidades Extendidas