logo

Aprendizaje automático supervisado

El aprendizaje supervisado es el tipo de aprendizaje automático en el que las máquinas se entrenan utilizando datos de entrenamiento bien 'etiquetados' y, en base a esos datos, las máquinas predicen el resultado. Los datos etiquetados significan que algunos datos de entrada ya están etiquetados con la salida correcta.

En el aprendizaje supervisado, los datos de entrenamiento proporcionados a las máquinas funcionan como el supervisor que enseña a las máquinas a predecir la salida correctamente. Se aplica el mismo concepto que aprende un estudiante bajo la supervisión del maestro.

El aprendizaje supervisado es un proceso de proporcionar datos de entrada y datos de salida correctos al modelo de aprendizaje automático. El objetivo de un algoritmo de aprendizaje supervisado es encuentre una función de mapeo para mapear la variable de entrada (x) con la variable de salida (y) .

En el mundo real, el aprendizaje supervisado se puede utilizar para Evaluación de Riesgos, Clasificación de Imágenes, Detección de Fraude, Filtrado de Spam , etc.

¿Cómo funciona el aprendizaje supervisado?

En el aprendizaje supervisado, los modelos se entrenan utilizando un conjunto de datos etiquetados, donde el modelo aprende sobre cada tipo de datos. Una vez que se completa el proceso de entrenamiento, el modelo se prueba sobre la base de datos de prueba (un subconjunto del conjunto de entrenamiento) y luego predice el resultado.

El funcionamiento del aprendizaje supervisado se puede entender fácilmente con el siguiente ejemplo y diagrama:

convertir un int a cadena c++
Aprendizaje automático supervisado

Supongamos que tenemos un conjunto de datos de diferentes tipos de formas que incluyen cuadrados, rectángulos, triángulos y polígonos. Ahora el primer paso es entrenar el modelo para cada forma.

  • Si la forma dada tiene cuatro lados y todos los lados son iguales, entonces se etiquetará como Cuadrado .
  • Si la forma dada tiene tres lados, entonces se etiquetará como triángulo .
  • Si la forma dada tiene seis lados iguales, se etiquetará como hexágono .

Ahora, después del entrenamiento, probamos nuestro modelo usando el conjunto de prueba, y la tarea del modelo es identificar la forma.

La máquina ya está entrenada en todo tipo de formas, y cuando encuentra una nueva forma, la clasifica en función de varios lados y predice el resultado.

Pasos involucrados en el aprendizaje supervisado:

  • Primero determine el tipo de conjunto de datos de entrenamiento.
  • Recopile/Reúna los datos de entrenamiento etiquetados.
  • Dividir el conjunto de datos de entrenamiento en entrenamiento conjunto de datos, conjunto de datos de prueba y conjunto de datos de validación .
  • Determine las características de entrada del conjunto de datos de entrenamiento, que deben tener suficiente conocimiento para que el modelo pueda predecir con precisión la salida.
  • Determine el algoritmo adecuado para el modelo, como máquina de vectores de soporte, árbol de decisión, etc.
  • Ejecute el algoritmo en el conjunto de datos de entrenamiento. A veces necesitamos conjuntos de validación como parámetros de control, que son el subconjunto de conjuntos de datos de entrenamiento.
  • Evalúe la precisión del modelo proporcionando el conjunto de prueba. Si el modelo predice el resultado correcto, significa que nuestro modelo es preciso.

Tipos de algoritmos de aprendizaje automático supervisados:

El aprendizaje supervisado se puede dividir en dos tipos de problemas:

Aprendizaje automático supervisado

1. Regresión

Los algoritmos de regresión se utilizan si existe una relación entre la variable de entrada y la variable de salida. Se utiliza para la predicción de variables continuas, como el pronóstico del tiempo, las tendencias del mercado, etc. A continuación se muestran algunos algoritmos de regresión populares que se incluyen en el aprendizaje supervisado:

  • Regresión lineal
  • Árboles de regresión
  • Regresión no lineal
  • Regresión lineal bayesiana
  • Regresión polinomial

2. Clasificación

Los algoritmos de clasificación se utilizan cuando la variable de salida es categórica, lo que significa que hay dos clases como Sí-No, Hombre-Mujer, Verdadero-falso, etc.

filtrado de spam,

  • Bosque aleatorio
  • Árboles de decisión
  • Regresión logística
  • Máquinas de vectores de soporte

Nota: Discutiremos estos algoritmos en detalle en capítulos posteriores.

Ventajas del aprendizaje supervisado:

  • Con la ayuda del aprendizaje supervisado, el modelo puede predecir el resultado sobre la base de experiencias previas.
  • En el aprendizaje supervisado, podemos tener una idea exacta sobre las clases de objetos.
  • El modelo de aprendizaje supervisado nos ayuda a resolver varios problemas del mundo real, como detección de fraude, filtrado de spam , etc.

Desventajas del aprendizaje supervisado:

  • Los modelos de aprendizaje supervisado no son adecuados para manejar tareas complejas.
  • El aprendizaje supervisado no puede predecir el resultado correcto si los datos de la prueba son diferentes del conjunto de datos de entrenamiento.
  • La formación requirió muchos tiempos de cálculo.
  • En el aprendizaje supervisado, necesitamos suficiente conocimiento sobre las clases de objetos.