logo

Modelos de aprendizaje automático

Un modelo de aprendizaje automático se define como una representación matemática del resultado del proceso de capacitación. El aprendizaje automático es el estudio de diferentes algoritmos que pueden mejorar automáticamente a través de la experiencia y datos antiguos y construir el modelo. Un modelo de aprendizaje automático es similar a un software de computadora diseñado para reconocer patrones o comportamientos basados ​​en experiencias o datos previos. El algoritmo de aprendizaje descubre patrones dentro de los datos de entrenamiento y genera un modelo de aprendizaje automático que captura estos patrones y hace predicciones sobre nuevos datos.

Modelos de aprendizaje automático

Entendamos un ejemplo del modelo ML en el que estamos creando una aplicación para reconocer las emociones del usuario en función de las expresiones faciales. Por lo tanto, crear una aplicación de este tipo es posible mediante modelos de aprendizaje automático en los que entrenaremos un modelo alimentando imágenes de rostros con varias emociones etiquetadas. Siempre que se utiliza esta aplicación para determinar el estado de ánimo del usuario, lee todos los datos proporcionados y luego determina el estado de ánimo de cualquier usuario.

Por lo tanto, en palabras simples, podemos decir que un El modelo de aprendizaje automático es una representación simplificada de algo o un proceso. En este tema, discutiremos diferentes modelos de aprendizaje automático y sus técnicas y algoritmos. .

¿Qué es el modelo de aprendizaje automático?

Los modelos de aprendizaje automático pueden entenderse como un programa que ha sido entrenado para encontrar patrones dentro de nuevos datos y hacer predicciones. Estos modelos se representan como una función matemática que recibe solicitudes en forma de datos de entrada, hace predicciones sobre los datos de entrada y luego proporciona una salida como respuesta. Primero, estos modelos se entrenan sobre un conjunto de datos y luego se les proporciona un algoritmo para razonar sobre los datos, extraer el patrón de los datos del feed y aprender de esos datos. Una vez que estos modelos se entrenan, se pueden utilizar para predecir el conjunto de datos invisible.

Hay varios tipos de modelos de aprendizaje automático disponibles según diferentes objetivos comerciales y conjuntos de datos.

Clasificación de modelos de aprendizaje automático:

Según diferentes objetivos comerciales y conjuntos de datos, existen tres modelos de aprendizaje para algoritmos. Cada algoritmo de aprendizaje automático se instala en uno de los tres modelos:

  • Aprendizaje supervisado
  • Aprendizaje sin supervisión
  • Aprendizaje reforzado
Modelos de aprendizaje automático

El aprendizaje supervisado se divide a su vez en dos categorías:

  • Clasificación
  • Regresión

El aprendizaje no supervisado también se divide en las siguientes categorías:

  • Agrupación
  • Regla de asociación
  • Reducción de dimensionalidad

1. Modelos de aprendizaje automático supervisados

El aprendizaje supervisado es el modelo de aprendizaje automático más simple para comprender en qué datos de entrada se denominan datos de entrenamiento y tienen una etiqueta o resultado conocido como salida. Entonces, funciona según el principio de pares entrada-salida. Requiere crear una función que pueda entrenarse utilizando un conjunto de datos de entrenamiento y luego se aplica a datos desconocidos y realiza algún rendimiento predictivo. El aprendizaje supervisado se basa en tareas y se prueba en conjuntos de datos etiquetados.

Podemos implementar un modelo de aprendizaje supervisado en problemas simples de la vida real. Por ejemplo, tenemos un conjunto de datos que consta de edad y altura; luego, podemos construir un modelo de aprendizaje supervisado para predecir la altura de la persona en función de su edad.

Los modelos de aprendizaje supervisado se clasifican además en dos categorías:

Regresión

En los problemas de regresión, la salida es una variable continua. Algunos modelos de regresión comúnmente utilizados son los siguientes:

a) Regresión lineal

La regresión lineal es el modelo de aprendizaje automático más simple en el que intentamos predecir una variable de salida utilizando una o más variables de entrada. La representación de la regresión lineal es una ecuación lineal, que combina un conjunto de valores de entrada (x) y una salida prevista (y) para el conjunto de esos valores de entrada. Se representa en forma de línea:

Y = bx + c.

Modelos de aprendizaje automático

El objetivo principal del modelo de regresión lineal es encontrar la línea que mejor se ajuste a los puntos de datos.

La regresión lineal se extiende a regresión lineal múltiple (encontrar un plano de mejor ajuste) y regresión polinómica (encontrar la curva de mejor ajuste).

b) Árbol de decisión

idea intellij vs eclipse

Los árboles de decisión son modelos populares de aprendizaje automático que se pueden utilizar tanto para problemas de regresión como de clasificación.

Un árbol de decisiones utiliza una estructura similar a un árbol de decisiones junto con sus posibles consecuencias y resultados. En esto, cada nodo interno se utiliza para representar una prueba en un atributo; cada rama se utiliza para representar el resultado de la prueba. Cuantos más nodos tenga un árbol de decisión, más preciso será el resultado.

La ventaja de los árboles de decisión es que son intuitivos y fáciles de implementar, pero carecen de precisión.

Los árboles de decisión se utilizan ampliamente en Investigación de operaciones, específicamente en análisis de decisiones, planificación estratégica. , y principalmente en aprendizaje automático.

c) Bosque aleatorio

Random Forest es el método de aprendizaje conjunto, que consta de una gran cantidad de árboles de decisión. Cada árbol de decisión en un bosque aleatorio predice un resultado, y la predicción con la mayoría de votos se considera como resultado.

Se puede utilizar un modelo de bosque aleatorio para problemas tanto de regresión como de clasificación.

Para la tarea de clasificación, el resultado del bosque aleatorio se toma de la mayoría de votos. Mientras que en la tarea de regresión, el resultado se toma de la media o promedio de las predicciones generadas por cada árbol.

d) Redes neuronales

Las redes neuronales son el subconjunto del aprendizaje automático y también se conocen como redes neuronales artificiales. Las redes neuronales están formadas por neuronas artificiales y diseñadas de una manera que se asemeja a la estructura y el funcionamiento del cerebro humano. Cada neurona artificial se conecta con muchas otras neuronas en una red neuronal, y esos millones de neuronas conectadas crean una estructura cognitiva sofisticada.

Modelos de aprendizaje automático

Las redes neuronales constan de una estructura multicapa que contiene una capa de entrada, una o más capas ocultas y una capa de salida. A medida que cada neurona está conectada con otra neurona, transfiere datos de una capa a la otra neurona de las siguientes capas. Finalmente, los datos llegan a la última capa o capa de salida de la red neuronal y generan resultados.

Las redes neuronales dependen de los datos de entrenamiento para aprender y mejorar su precisión. Sin embargo, una red neuronal precisa y perfectamente entrenada puede agrupar datos rápidamente y convertirse en una poderosa herramienta de aprendizaje automático e inteligencia artificial. Una de las redes neuronales más conocidas es Algoritmo de búsqueda de Google.

Clasificación

Los modelos de clasificación son el segundo tipo de técnicas de aprendizaje supervisado, que se utilizan para generar conclusiones a partir de valores observados en forma categórica. Por ejemplo, el modelo de clasificación puede identificar si el correo electrónico es spam o no; un comprador comprará el producto o no, etc. Los algoritmos de clasificación se utilizan para predecir dos clases y categorizar el resultado en diferentes grupos.

En clasificación, se diseña un modelo clasificador que clasifica el conjunto de datos en diferentes categorías, y a cada categoría se le asigna una etiqueta.

Hay dos tipos de clasificaciones en el aprendizaje automático:

    Clasificación binaria: Si el problema tiene sólo dos clases posibles, se denomina clasificador binario. Por ejemplo, gato o perro, sí o no,Clasificación multiclase: Si el problema tiene más de dos clases posibles, es un clasificador multiclase.

Algunos algoritmos de clasificación populares son los siguientes:

a) Regresión logística

La regresión logística se utiliza para resolver los problemas de clasificación en el aprendizaje automático. Son similares a la regresión lineal pero se utilizan para predecir variables categóricas. Puede predecir la salida en Sí o No, 0 o 1, Verdadero o Falso, etc. Sin embargo, en lugar de dar los valores exactos, proporciona los valores probabilísticos entre 0 y 1.

b) Máquina de vectores de soporte

La máquina de vectores de soporte o SVM es el popular algoritmo de aprendizaje automático, que se utiliza ampliamente para tareas de clasificación y regresión. Sin embargo, específicamente, se utiliza para resolver problemas de clasificación. El objetivo principal de SVM es encontrar los mejores límites de decisión en un espacio N-dimensional, que pueda segregar puntos de datos en clases, y el mejor límite de decisión se conoce como hiperplano. SVM selecciona el vector extremo para encontrar el hiperplano, y estos vectores se conocen como vectores de soporte.

Modelos de aprendizaje automático

c) Bayes ingenuo

Naïve Bayes es otro algoritmo de clasificación popular utilizado en el aprendizaje automático. Se llama así porque se basa en el teorema de Bayes y sigue la suposición ingenua (independiente) entre las características que se da como:

Modelos de aprendizaje automático

Cada clasificador ingenuo de Bayes asume que el valor de una variable específica es independiente de cualquier otra variable/característica. Por ejemplo, si es necesario clasificar una fruta según su color, forma y sabor. Así, el mango será reconocido como amarillo, ovalado y dulce. Aquí cada característica es independiente de otras características.

2. Modelos de aprendizaje automático no supervisados

Los modelos de aprendizaje automático no supervisados ​​implementan el proceso de aprendizaje opuesto al aprendizaje supervisado, lo que significa que permiten que el modelo aprenda del conjunto de datos de entrenamiento sin etiquetar. Basado en el conjunto de datos sin etiquetar, el modelo predice el resultado. Mediante el aprendizaje no supervisado, el modelo aprende patrones ocultos del conjunto de datos por sí solo sin ninguna supervisión.

Los modelos de aprendizaje no supervisados ​​se utilizan principalmente para realizar tres tareas, que son las siguientes:

    Agrupación
    La agrupación es una técnica de aprendizaje no supervisada que implica agrupar o buscar a tientas los puntos de datos en diferentes grupos en función de similitudes y diferencias. Los objetos con más similitudes permanecen en el mismo grupo y tienen muy pocas o ninguna similitud con otros grupos.
    Los algoritmos de agrupamiento se pueden utilizar ampliamente en diferentes tareas, como Segmentación de imágenes, Análisis estadístico de datos, Segmentación de mercados , etc.
    Algunos algoritmos de agrupamiento comúnmente utilizados son Agrupación de K-medias, agrupación jerárquica, DBSCAN , etc.
    Modelos de aprendizaje automático Aprendizaje de reglas de asociación
    El aprendizaje de reglas de asociación es una técnica de aprendizaje no supervisada que encuentra relaciones interesantes entre variables dentro de un gran conjunto de datos. El objetivo principal de este algoritmo de aprendizaje es encontrar la dependencia de un elemento de datos de otro elemento de datos y asignar esas variables en consecuencia para que pueda generar el máximo beneficio. Este algoritmo se aplica principalmente en Análisis de Market Basket, minería de uso web, producción continua. , etc.
    Algunos algoritmos populares de aprendizaje de reglas de asociación son Algoritmo a priori, Eclat, algoritmo de crecimiento de FP. Reducción de dimensionalidad
    La cantidad de características/variables presentes en un conjunto de datos se conoce como dimensionalidad del conjunto de datos, y la técnica utilizada para reducir la dimensionalidad se conoce como técnica de reducción de dimensionalidad.
    Aunque más datos proporcionan resultados más precisos, también pueden afectar el rendimiento del modelo/algoritmo, como problemas de sobreajuste. En tales casos, se utilizan técnicas de reducción de dimensionalidad.
    ' Es un proceso de convertir el conjunto de datos de dimensiones superiores en un conjunto de datos de dimensiones menores, garantizando que proporcione información similar. .'
    Diferentes métodos de reducción de dimensionalidad como como PCA (Análisis de Componentes Principales), Descomposición de Valores Singulares, etc.

Aprendizaje reforzado

En el aprendizaje por refuerzo, el algoritmo aprende acciones para un conjunto determinado de estados que conducen a un estado objetivo. Es un modelo de aprendizaje basado en retroalimentación que toma señales de retroalimentación después de cada estado o acción al interactuar con el entorno. Esta retroalimentación funciona como una recompensa (positiva por cada buena acción y negativa por cada mala acción), y el objetivo del agente es maximizar las recompensas positivas para mejorar su desempeño.

El comportamiento del modelo en el aprendizaje por refuerzo es similar al aprendizaje humano, ya que los humanos aprenden cosas a través de experiencias como retroalimentación e interactúan con el entorno.

A continuación se muestran algunos algoritmos populares que se incluyen en el aprendizaje por refuerzo:

    Q-aprendizaje:Q-learning es uno de los algoritmos populares de aprendizaje por refuerzo sin modelos, que se basa en la ecuación de Bellman.

Su objetivo es conocer la política que puede ayudar al agente de IA a tomar la mejor acción para maximizar la recompensa en una circunstancia específica. Incorpora valores Q para cada par estado-acción que indican la recompensa por seguir un camino de estado determinado e intenta maximizar el valor Q.

    Estado-Acción-Recompensa-Estado-Acción (SARSA):SARSA es un algoritmo de política basado en el proceso de decisión de Markov. Utiliza la acción realizada por la política actual para conocer el valor Q. El algoritmo SARSA se encuentra para Acción Estatal Recompensa Acción Estatal, que simboliza la tupla (s, a, r, s', a'). Red Q profunda:DQN o la red neuronal Deep Q es Q-learning dentro de la red neuronal. Básicamente se emplea en un entorno de gran espacio de estados donde definir una tabla Q sería una tarea compleja. Entonces, en tal caso, en lugar de usar la tabla Q, la red neuronal usa valores Q para cada acción según el estado.

Entrenamiento de modelos de aprendizaje automático

Una vez construido el modelo de aprendizaje automático, se entrena para obtener los resultados adecuados. Para entrenar un modelo de aprendizaje automático, se necesita una gran cantidad de datos preprocesados. Aquí, los datos preprocesados ​​significan datos en forma estructurada con valores nulos reducidos, etc. Si no proporcionamos datos preprocesados, existen grandes posibilidades de que nuestro modelo funcione terriblemente.

¿Cómo elegir el mejor modelo?

En la sección anterior, analizamos diferentes modelos y algoritmos de aprendizaje automático. Pero una de las preguntas más confusas que le puede surgir a cualquier principiante es '¿qué modelo debo elegir?'. Entonces, la respuesta es que depende principalmente de los requisitos del negocio o del proyecto. Aparte de esto, también depende de los atributos asociados, el volumen del conjunto de datos disponible, la cantidad de características, la complejidad, etc. Sin embargo, en la práctica, se recomienda que siempre comencemos con el modelo más simple que se pueda aplicar al particular. problema y luego mejorar gradualmente la complejidad y probar la precisión con la ayuda del ajuste de parámetros y la validación cruzada.

Diferencia entre modelo de aprendizaje automático y algoritmos

Una de las preguntas más confusas entre los principiantes es: ¿los modelos de aprendizaje automático y los algoritmos son los mismos? Porque en varios casos de aprendizaje automático y ciencia de datos, estos dos términos se usan indistintamente.

La respuesta a esta pregunta es No, y el modelo de aprendizaje automático no es lo mismo que un algoritmo. De forma sencilla, un El algoritmo ML es como un procedimiento o método que se ejecuta con datos para descubrir patrones a partir de ellos. y generar el modelo. Al mismo tiempo, un El modelo de aprendizaje automático es como un programa de computadora que genera resultados o hace predicciones. . Más concretamente, cuando entrenamos un algoritmo con datos, se convierte en un modelo.

 Machine Learning Model = Model Data + Prediction Algorithm