El aprendizaje automático es una rama de la informática y la inteligencia artificial. Se basa en el entrenamiento de un modelo estadístico a partir de un conjunto de datos, de tal modo que el modelo puede luego hacer predicciones sobre nuevos datos del mismo tipo.

Por ejemplo, si tuviéramos un conjunto de datos con características de frutas (color, textura, tamaño) etiquetadas con el tipo de fruta que es cada ejemplo (piña, manzana o naranja), nuestro modelo aprendería de estos datos y podría predecir para un ejemplo que aún no está etiquetado qué tipo de fruta es en función de estas características con las que hemos entrenado el modelo.

Como parte de un trabajo reciente, publicado en Neurocomputing, el Grupo de Aprendizaje Automático (GAA) de la Universidad Autónoma de Madrid (UAM) ha entrenado un tipo de modelos de aprendizaje automático llamados procesos Gaussianos, logrando predicciones aún más precisas.

Los procesos Gaussianos tienen la ventaja de que, al ser modelos Bayesianos, proporcionan una estimación de la incertidumbre asociada a las predicciones; en otras palabras, nos dicen cómo de fiables son estas predicciones.

Esto es crítico en ciertas aplicaciones en las que tomar una mala decisión puede tener consecuencias desastrosas. Por ejemplo, el software de un coche autónomo podría determinar que delante de él no hay peatones cruzando un paso de cebra y producirse un atropello porque en realidad sí los había. Si supiera que su predicción no es muy fiable, el coche podría extremar la precaución y evitar el accidente.

Clasificación multiclase y medidas de divergencia

En su trabajo, los autores consideran problemas de clasificación multiclase, es decir, problemas en los que la predicción del modelo será una etiqueta de entre un conjunto finito de un mínimo de tres elementos, como en el ejemplo de clasificar frutas mencionado anteriormente, en la que teníamos tres tipos de fruta: piñas, manzanas y naranjas.

“Se puede interpretar la regla que asigna una etiqueta de clase para cada dato de entrada como una función. El algoritmo de aprendizaje consiste en calcular qué funciones son compatibles con los datos observados. Para ello se obtiene una distribución de probabilidad sobre funciones. La distribución exacta es muy complicada y debe aproximarse”, explican los autores.

“Este proceso —agregan— se lleva a cabo usando una distribución aproximada que es ajustada mediante la minimización de la divergencia de Kullback-Leibler. Esta divergencia será más pequeña cuanto mejor sea la aproximación que usemos”.

Los resultados muestran que con este tipo de modelos se puede utilizar una familia de medidas de divergencia llamadas α-divergencias, que se pueden ver como una generalización de la divergencia de Kullback-Leibler, con un parámetro α que se puede variar para cambiar la medida de divergencia.

A su vez, los autores demuestran en varios experimentos que variando el valor de este parámetro se pueden obtener predicciones más certeras que con la divergencia de Kullback-Leibler. Esto, como ya se ha mencionado, es importante para aplicaciones en las que nos interesa no solo acertar con las predicciones que se hacen, sino también conocer la incertidumbre de estas predicciones.

_____________________

Referencia bibliográfica:

Villacampa-Calvo, Carlos & Hernández-Lobato, Daniel. 2020. Alpha divergence minimization in multi-class Gaussian process classification. Neurocomputing 378, 210-227. https://doi.org/10.1016/j.neucom.2019.09.090

Subscribirse al Directorio
Escribir un Artículo

Últimas Noticias

Uso de RNA móviles para mejorar la asim...

El gen AtCDF3 promueve una mayor producción de az...

El diagnóstico genético neonatal mejor...

Un estudio con datos de los últimos 35 años, ind...

Más de 1.500 cambios epigenéticos en e...

Un equipo de investigadores de la Universidad Juli...

Destacadas

Eosinófilos. ¿Qué significa tener val...

by Labo'Life

En nuestro post hablamos sobre este interesante tipo de célula del si...

Horizon pone en marcha una planta punter...

by Horizon Products

Horizon ha puesto en funcionamiento una nueva planta dedicada íntegra...

Diapositiva de Fotos