En el tema anterior, aprendimos el aprendizaje automático supervisado en el que los modelos se entrenan utilizando datos etiquetados bajo la supervisión de datos de entrenamiento. Pero puede haber muchos casos en los que no tengamos datos etiquetados y necesitemos encontrar los patrones ocultos en el conjunto de datos dado. Entonces, para resolver este tipo de casos en el aprendizaje automático, necesitamos técnicas de aprendizaje no supervisadas.
¿Qué es el aprendizaje no supervisado?
Como sugiere el nombre, el aprendizaje no supervisado es una técnica de aprendizaje automático en la que los modelos no se supervisan mediante un conjunto de datos de entrenamiento. En cambio, los propios modelos encuentran patrones ocultos y conocimientos a partir de los datos proporcionados. Se puede comparar con el aprendizaje que tiene lugar en el cerebro humano mientras se aprenden cosas nuevas. Se puede definir como:
¿Qué es Mac OS?
El aprendizaje no supervisado es un tipo de aprendizaje automático en el que los modelos se entrenan utilizando un conjunto de datos sin etiquetar y se les permite actuar sobre esos datos sin ninguna supervisión.
El aprendizaje no supervisado no se puede aplicar directamente a un problema de regresión o clasificación porque, a diferencia del aprendizaje supervisado, tenemos los datos de entrada pero no los datos de salida correspondientes. El objetivo del aprendizaje no supervisado es encontrar la estructura subyacente del conjunto de datos, agrupar esos datos según similitudes y representar ese conjunto de datos en un formato comprimido .
Ejemplo: Supongamos que al algoritmo de aprendizaje no supervisado se le proporciona un conjunto de datos de entrada que contiene imágenes de diferentes tipos de perros y gatos. El algoritmo nunca se entrena con el conjunto de datos dado, lo que significa que no tiene idea de las características del conjunto de datos. La tarea del algoritmo de aprendizaje no supervisado es identificar las características de la imagen por sí solos. El algoritmo de aprendizaje no supervisado realizará esta tarea agrupando el conjunto de datos de imágenes en grupos de acuerdo con las similitudes entre las imágenes.
¿Por qué utilizar el aprendizaje no supervisado?
A continuación se presentan algunas razones principales que describen la importancia del aprendizaje no supervisado:
- El aprendizaje no supervisado es útil para encontrar información útil a partir de los datos.
- El aprendizaje no supervisado es muy similar a cómo un humano aprende a pensar según sus propias experiencias, lo que lo acerca más a la IA real.
- El aprendizaje no supervisado funciona con datos no etiquetados ni categorizados, lo que hace que el aprendizaje no supervisado sea más importante.
- En el mundo real, no siempre tenemos datos de entrada con la salida correspondiente, por lo que para resolver estos casos necesitamos un aprendizaje no supervisado.
Funcionamiento del aprendizaje no supervisado
El funcionamiento del aprendizaje no supervisado se puede entender mediante el siguiente diagrama:
Aquí, hemos tomado datos de entrada sin etiquetar, lo que significa que no están categorizados y tampoco se proporcionan las salidas correspondientes. Ahora, estos datos de entrada sin etiquetar se envían al modelo de aprendizaje automático para entrenarlo. En primer lugar, interpretará los datos sin procesar para encontrar los patrones ocultos de los datos y luego aplicará algoritmos adecuados como agrupación de k-medias, árbol de decisión, etc.
Una vez que aplica el algoritmo adecuado, el algoritmo divide los objetos de datos en grupos según las similitudes y diferencias entre los objetos.
Tipos de algoritmos de aprendizaje no supervisados:
El algoritmo de aprendizaje no supervisado se puede clasificar en dos tipos de problemas:
Nota: Aprenderemos estos algoritmos en capítulos posteriores.
Algoritmos de aprendizaje no supervisado:
A continuación se muestra la lista de algunos algoritmos de aprendizaje no supervisados populares:
tamaño de fuente de látex
Ventajas del aprendizaje no supervisado
- El aprendizaje no supervisado se utiliza para tareas más complejas en comparación con el aprendizaje supervisado porque, en el aprendizaje no supervisado, no tenemos datos de entrada etiquetados.
- Es preferible el aprendizaje no supervisado, ya que es más fácil obtener datos sin etiquetar que datos etiquetados.
Desventajas del aprendizaje no supervisado
- El aprendizaje no supervisado es intrínsecamente más difícil que el aprendizaje supervisado, ya que no tiene el resultado correspondiente.
- El resultado del algoritmo de aprendizaje no supervisado podría ser menos preciso ya que los datos de entrada no están etiquetados y los algoritmos no conocen de antemano el resultado exacto.