logo

Tipos de aprendizaje automático

El aprendizaje automático es un subconjunto de la IA que permite a la máquina aprender automáticamente a partir de datos, mejorar el rendimiento de experiencias pasadas y hacer predicciones. . El aprendizaje automático contiene un conjunto de algoritmos que funcionan con una gran cantidad de datos. Los datos se alimentan a estos algoritmos para entrenarlos y, sobre la base del entrenamiento, construyen el modelo y realizan una tarea específica.

Tipos de aprendizaje automático

Estos algoritmos de ML ayudan a resolver diferentes problemas comerciales como regresión, clasificación, previsión, agrupación y asociaciones, etc.

Según los métodos y la forma de aprendizaje, el aprendizaje automático se divide principalmente en cuatro tipos, que son:

  1. Aprendizaje automático supervisado
  2. Aprendizaje automático no supervisado
  3. Aprendizaje automático semisupervisado
  4. Aprendizaje reforzado
Tipos de aprendizaje automático

En este tema, proporcionaremos una descripción detallada de los tipos de Machine Learning junto con sus respectivos algoritmos:

java obtener fecha actual

1. Aprendizaje automático supervisado

Como sugiere su nombre, Aprendizaje automático supervisado se basa en la supervisión. Significa que en la técnica de aprendizaje supervisado, entrenamos las máquinas utilizando el conjunto de datos 'etiquetado' y, en función del entrenamiento, la máquina predice el resultado. Aquí, los datos etiquetados especifican que algunas de las entradas ya están asignadas a la salida. Más preciosamente, podemos decir; Primero, entrenamos la máquina con la entrada y la salida correspondiente, y luego le pedimos a la máquina que prediga la salida utilizando el conjunto de datos de prueba.

Entendamos el aprendizaje supervisado con un ejemplo. Supongamos que tenemos un conjunto de datos de entrada de imágenes de perros y gatos. Entonces, primero, capacitaremos a la máquina para que comprenda las imágenes, como la forma y tamaño de la cola del perro y del gato, forma de los ojos, color, altura (los perros son más altos, los gatos son más pequeños), etc. Después de completar el entrenamiento, ingresamos la imagen de un gato y le pedimos a la máquina que identifique el objeto y prediga el resultado. Ahora, la máquina está bien entrenada, por lo que comprobará todas las características del objeto, como altura, forma, color, ojos, orejas, cola, etc., y descubrirá que es un gato. Entonces, lo pondrá en la categoría Cat. Este es el proceso por el cual la máquina identifica los objetos en el Aprendizaje Supervisado.

El objetivo principal de la técnica de aprendizaje supervisado es mapear la variable de entrada (x) con la variable de salida (y). Algunas aplicaciones del mundo real del aprendizaje supervisado son Evaluación de riesgos, Detección de fraude, Filtrado de spam, etc.

Categorías de aprendizaje automático supervisado

El aprendizaje automático supervisado se puede clasificar en dos tipos de problemas, que se detallan a continuación:

    Clasificación Regresión

a) Clasificación

Los algoritmos de clasificación se utilizan para resolver los problemas de clasificación en los que la variable de salida es categórica, como ' Sí o No, Hombre o Mujer, Rojo o Azul, etc. . Los algoritmos de clasificación predicen las categorías presentes en el conjunto de datos. Algunos ejemplos del mundo real de algoritmos de clasificación son Detección de spam, filtrado de correo electrónico, etc.

A continuación se detallan algunos algoritmos de clasificación populares:

    Algoritmo de bosque aleatorio Algoritmo de árbol de decisión Algoritmo de regresión logística Algoritmo de máquina de vectores de soporte

b) Regresión

Los algoritmos de regresión se utilizan para resolver problemas de regresión en los que existe una relación lineal entre las variables de entrada y salida. Se utilizan para predecir variables continuas de producción, como tendencias del mercado, predicción del tiempo, etc.

A continuación se detallan algunos algoritmos de regresión populares:

    Algoritmo de regresión lineal simple Algoritmo de regresión multivariante Algoritmo de árbol de decisión Regresión de lazo

Ventajas y desventajas del aprendizaje supervisado

Ventajas:

  • Dado que el aprendizaje supervisado funciona con el conjunto de datos etiquetado, podemos tener una idea exacta sobre las clases de objetos.
  • Estos algoritmos son útiles para predecir el resultado basándose en experiencias previas.

Desventajas:

  • Estos algoritmos no pueden resolver tareas complejas.
  • Puede predecir una salida incorrecta si los datos de la prueba son diferentes de los datos de entrenamiento.
  • Se requiere mucho tiempo computacional para entrenar el algoritmo.

Aplicaciones del aprendizaje supervisado

A continuación se detallan algunas aplicaciones comunes del aprendizaje supervisado:

    Segmentación de imagen:
    Los algoritmos de aprendizaje supervisado se utilizan en la segmentación de imágenes. En este proceso, la clasificación de imágenes se realiza en diferentes datos de imagen con etiquetas predefinidas.Diagnostico medico:
    Los algoritmos supervisados ​​también se utilizan en el campo médico con fines de diagnóstico. Se realiza mediante el uso de imágenes médicas y datos etiquetados anteriormente con etiquetas para enfermedades. Con este proceso, la máquina puede identificar una enfermedad para los nuevos pacientes.Detección de fraude -Los algoritmos de clasificación de aprendizaje supervisado se utilizan para identificar transacciones fraudulentas, clientes fraudulentos, etc. Se realiza mediante el uso de datos históricos para identificar los patrones que pueden conducir a un posible fraude.Detección de spam -En la detección y filtrado de spam, se utilizan algoritmos de clasificación. Estos algoritmos clasifican un correo electrónico como spam o no spam. Los correos electrónicos no deseados se envían a la carpeta de spam.Reconocimiento de voz -Los algoritmos de aprendizaje supervisado también se utilizan en el reconocimiento de voz. El algoritmo se entrena con datos de voz y con ellos se pueden realizar diversas identificaciones, como contraseñas activadas por voz, comandos de voz, etc.

2. Aprendizaje automático no supervisado

Aprendizaje no supervisado g es diferente de la técnica de aprendizaje supervisado; Como su nombre indica, no hay necesidad de supervisión. Significa que, en el aprendizaje automático no supervisado, la máquina se entrena utilizando el conjunto de datos sin etiquetar y predice el resultado sin ninguna supervisión.

En el aprendizaje no supervisado, los modelos se entrenan con datos que no están clasificados ni etiquetados, y el modelo actúa sobre esos datos sin ninguna supervisión.

El objetivo principal del algoritmo de aprendizaje no supervisado es agrupar o clasificar el conjunto de datos sin clasificar según las similitudes, patrones y diferencias. Las máquinas reciben instrucciones de encontrar los patrones ocultos en el conjunto de datos de entrada.

Tomemos un ejemplo para entenderlo más detalladamente; Supongamos que hay una canasta con imágenes de frutas y la ingresamos en el modelo de aprendizaje automático. Las imágenes son totalmente desconocidas para el modelo, y la tarea de la máquina es encontrar los patrones y categorías de los objetos.

mb en gb

Entonces, ahora la máquina descubrirá sus patrones y diferencias, como la diferencia de color, la diferencia de forma, y ​​predecirá el resultado cuando se pruebe con el conjunto de datos de prueba.

Categorías de aprendizaje automático no supervisado

El aprendizaje no supervisado se puede clasificar en dos tipos, que se detallan a continuación:

    Agrupación Asociación

1) Agrupación

La técnica de agrupamiento se utiliza cuando queremos encontrar los grupos inherentes a partir de los datos. Es una forma de agrupar los objetos en un grupo de modo que los objetos con más similitudes permanezcan en un grupo y tengan menos o ninguna similitud con los objetos de otros grupos. Un ejemplo del algoritmo de agrupación es agrupar a los clientes según su comportamiento de compra.

Algunos de los algoritmos de agrupación populares se detallan a continuación:

    Algoritmo de agrupación de K-medias Algoritmo de cambio medio Algoritmo DBSCAN Análisis de componentes principales Análisis de componentes independientes

2) Asociación

El aprendizaje de reglas de asociación es una técnica de aprendizaje no supervisada que encuentra relaciones interesantes entre variables dentro de un gran conjunto de datos. El objetivo principal de este algoritmo de aprendizaje es encontrar la dependencia de un elemento de datos de otro elemento de datos y asignar esas variables en consecuencia para que pueda generar el máximo beneficio. Este algoritmo se aplica principalmente en Análisis de Market Basket, minería de uso web, producción continua. , etc.

Algunos algoritmos populares de aprendizaje de reglas de asociación son Algoritmo a priori, Eclat, algoritmo de crecimiento de FP.

Ventajas y desventajas del algoritmo de aprendizaje no supervisado

Ventajas:

  • Estos algoritmos se pueden utilizar para tareas complicadas en comparación con las supervisadas porque funcionan en conjuntos de datos sin etiquetar.
  • Los algoritmos no supervisados ​​son preferibles para diversas tareas, ya que obtener el conjunto de datos sin etiquetar es más fácil en comparación con el conjunto de datos etiquetado.

Desventajas:

  • El resultado de un algoritmo no supervisado puede ser menos preciso ya que el conjunto de datos no está etiquetado y los algoritmos no se entrenan con el resultado exacto anteriormente.
  • Trabajar con aprendizaje no supervisado es más difícil ya que funciona con un conjunto de datos sin etiquetar que no se corresponde con la salida.

Aplicaciones del aprendizaje no supervisado

    Análisis de red:El aprendizaje no supervisado se utiliza para identificar plagio y derechos de autor en el análisis de redes de documentos de datos de texto para artículos académicos.Sistemas de recomendación:Los sistemas de recomendación utilizan ampliamente técnicas de aprendizaje no supervisadas para crear aplicaciones de recomendación para diferentes aplicaciones web y sitios web de comercio electrónico.Detección de anomalías:La detección de anomalías es una aplicación popular de aprendizaje no supervisado, que puede identificar puntos de datos inusuales dentro del conjunto de datos. Se utiliza para descubrir transacciones fraudulentas.Valor singular de descomposición:La descomposición de valores singulares o SVD se utiliza para extraer información particular de la base de datos. Por ejemplo, extraer información de cada usuario ubicado en una ubicación particular.

3. Aprendizaje semisupervisado

El aprendizaje semisupervisado es un tipo de algoritmo de aprendizaje automático que se encuentra entre el aprendizaje automático supervisado y el no supervisado. . Representa el punto intermedio entre los algoritmos de aprendizaje supervisado (con datos de entrenamiento etiquetados) y no supervisado (sin datos de entrenamiento etiquetados) y utiliza la combinación de conjuntos de datos etiquetados y no etiquetados durante el período de entrenamiento.

A Aunque el aprendizaje semisupervisado es el término medio entre el aprendizaje supervisado y no supervisado y opera con datos que constan de unas pocas etiquetas, en su mayoría consiste en datos sin etiquetar. Como las etiquetas son costosas, pero para fines corporativos, es posible que tengan pocas etiquetas. Es completamente diferente del aprendizaje supervisado y no supervisado, ya que se basan en la presencia y ausencia de etiquetas.

desactivar el modo desarrollador android

Para superar los inconvenientes del aprendizaje supervisado y de los algoritmos de aprendizaje no supervisado, se introduce el concepto de aprendizaje semisupervisado. . El objetivo principal del aprendizaje semisupervisado es utilizar eficazmente todos los datos disponibles, en lugar de sólo datos etiquetados como en el aprendizaje supervisado. Inicialmente, los datos similares se agrupan junto con un algoritmo de aprendizaje no supervisado y, además, ayuda a etiquetar los datos sin etiquetar en datos etiquetados. Esto se debe a que los datos etiquetados son una adquisición comparativamente más costosa que los datos no etiquetados.

Podemos imaginar estos algoritmos con un ejemplo. El aprendizaje supervisado es cuando un estudiante está bajo la supervisión de un instructor en casa y en la universidad. Además, si ese estudiante autoanaliza el mismo concepto sin la ayuda del instructor, se considera aprendizaje no supervisado. En el aprendizaje semisupervisado, el estudiante tiene que revisarse a sí mismo después de analizar el mismo concepto bajo la guía de un instructor en la universidad.

Ventajas y desventajas del Aprendizaje Semisupervisado

Ventajas:

  • Es simple y fácil de entender el algoritmo.
  • Es muy eficiente.
  • Se utiliza para resolver los inconvenientes de los algoritmos de aprendizaje supervisado y no supervisado.

Desventajas:

  • Es posible que los resultados de las iteraciones no sean estables.
  • No podemos aplicar estos algoritmos a datos a nivel de red.
  • La precisión es baja.

4. Aprendizaje por refuerzo

El aprendizaje por refuerzo funciona en un proceso basado en retroalimentación, en el que un agente de IA (un componente de software) explora automáticamente su entorno siguiendo y siguiendo, tomando medidas, aprendiendo de las experiencias y mejorando su rendimiento. El agente es recompensado por cada buena acción y castigado por cada mala acción; por tanto, el objetivo del agente de aprendizaje por refuerzo es maximizar las recompensas.

En el aprendizaje por refuerzo, no hay datos etiquetados como en el aprendizaje supervisado, y los agentes aprenden únicamente de sus experiencias.

El proceso de aprendizaje por refuerzo es similar al de un ser humano; por ejemplo, un niño aprende varias cosas a través de experiencias de su vida cotidiana. Un ejemplo de aprendizaje por refuerzo es jugar un juego, donde el Juego es el entorno, los movimientos de un agente en cada paso definen estados y el objetivo del agente es obtener una puntuación alta. El agente recibe retroalimentación en términos de castigo y recompensa.

Por su forma de funcionar, el aprendizaje por refuerzo se emplea en diferentes campos como Teoría de juegos, Investigación operativa, Teoría de la información, sistemas multiagente.

Un problema de aprendizaje por refuerzo se puede formalizar utilizando Proceso de Decisión de Markov (MDP). En MDP, el agente interactúa constantemente con el entorno y realiza acciones; a cada acción, el entorno responde y genera un nuevo estado.

Categorías de aprendizaje por refuerzo

El aprendizaje por refuerzo se clasifica principalmente en dos tipos de métodos/algoritmos:

diferencia entre zorro y lobo
    Aprendizaje por refuerzo positivo:El aprendizaje por refuerzo positivo especifica aumentar la tendencia a que el comportamiento requerido vuelva a ocurrir al agregar algo. Potencia la fuerza del comportamiento del agente e impacta positivamente en él.Aprendizaje por refuerzo negativo:El aprendizaje por refuerzo negativo funciona exactamente al revés del RL positivo. Aumenta la tendencia a que la conducta específica vuelva a ocurrir al evitar la condición negativa.

Casos de uso del aprendizaje por refuerzo en el mundo real

    Juegos de vídeo:
    Los algoritmos RL son muy populares en las aplicaciones de juegos. Se utiliza para obtener un rendimiento sobrehumano. Algunos juegos populares que utilizan algoritmos RL son AlfaGO y AlfaGO cero .Administracion de recursos:
    El documento 'Gestión de recursos con aprendizaje por refuerzo profundo' mostró cómo utilizar RL en la computadora para aprender y programar recursos automáticamente para esperar diferentes trabajos con el fin de minimizar la desaceleración promedio del trabajo.Robótica:
    RL se utiliza ampliamente en aplicaciones de robótica. Los robots se utilizan en el área industrial y de fabricación, y estos robots se vuelven más potentes con el aprendizaje por refuerzo. Hay diferentes industrias que tienen la visión de construir robots inteligentes utilizando inteligencia artificial y tecnología de aprendizaje automático.Extracción de textos
    La minería de textos, una de las grandes aplicaciones de la PNL, se está implementando ahora con la ayuda del aprendizaje por refuerzo de la empresa Salesforce.

Ventajas y desventajas del aprendizaje por refuerzo

Ventajas

  • Ayuda a resolver problemas complejos del mundo real que son difíciles de resolver mediante técnicas generales.
  • El modelo de aprendizaje de RL es similar al aprendizaje de los seres humanos; por lo tanto, se pueden encontrar resultados más precisos.
  • Ayuda a lograr resultados a largo plazo.

Desventaja

  • Los algoritmos RL no se prefieren para problemas simples.
  • Los algoritmos de RL requieren una gran cantidad de datos y cálculos.
  • Demasiado aprendizaje por refuerzo puede conducir a una sobrecarga de estados que puede debilitar los resultados.

La maldición de la dimensionalidad limita el aprendizaje por refuerzo para sistemas físicos reales.