ALGORITMOS DE APRENDIZAJE AUTOMÁTICO

Algoritmos de aprendizaje automático Son modelos computacionales que permiten a las computadoras comprender patrones y pronosticar o emitir juicios basados en datos sin necesidad de programación explícita. Estos algoritmos forman la base de la inteligencia artificial moderna y se utilizan en una amplia gama de aplicaciones, incluido el reconocimiento de imágenes y voz, el procesamiento del lenguaje natural, los sistemas de recomendación, la detección de fraudes, los vehículos autónomos, etc.

Este Algoritmos de aprendizaje automático El artículo cubrirá todos los algoritmos esenciales del aprendizaje automático como Máquina de vectores de soporte, toma de decisiones, regresión logística, clasificador ingenuo de bayees, bosque aleatorio, agrupación de k-media, aprendizaje por refuerzo, vector, agrupación jerárquica, xgboost, adaboost, logística, etc.

Tipos de algoritmos de aprendizaje automático

Hay tres tipos de algoritmos de aprendizaje automático.

Aprendizaje supervisado
- Regresión
- Clasificación
Aprendizaje sin supervisión
- Agrupación
- Reducción de dimensionalidad
Aprendizaje reforzado

Tipos de algoritmos de aprendizaje automático

1. Algoritmo de aprendizaje supervisado

Aprendizaje supervisado es un tipo de algoritmos de aprendizaje automático en el que utilizamos un conjunto de datos etiquetados para entrenar el modelo o los algoritmos. El objetivo del algoritmo es aprender un mapeo de los datos de entrada a las etiquetas de salida, lo que le permite hacer predicciones o clasificaciones sobre datos nuevos e invisibles.

en orden

Algoritmos de aprendizaje automático supervisados
Modelo lineal: Regresión Regresión de mínimos cuadrados ordinarios Regresión lineal simple Regresión lineal múltiple Regresión polinomial Persecución de emparejamiento ortogonal (OMP) Regresión bayesiana Regresión cuantil regresión isotónica Regresión paso a paso Regresión de ángulo mínimo (LARS) Clasificación: Regresión logística Funciones sigmoideas y Softmax Regularización : Lazo (regularización L1) Cresta (regularización L2) Regresión de cresta Clasificador de crestas Red elástica LARS Lazo K-Vecinos más cercanos (KNN): Algoritmos de fuerza bruta Algoritmos de árbol de bolas y árbol KD Clasificador K-Vecinos más cercanos (KNN) Regresor K-vecinos más cercanos (KNN) Máquinas de vectores de soporte: Regresor de máquinas de vectores de soporte Diferentes funciones del kernel en SVM Descenso del gradiente estocástico Clasificador de descenso de gradiente estocástico Regresor de descenso de gradiente estocástico Diferentes funciones de pérdida en SGD Árbol de decisión: Algoritmos de árbol de decisión Algoritmos iterativos del dicotomizador 3 (ID3) C5. Algoritmos Algoritmos de clasificación y árboles de regresión Clasificador de árbol de decisión Regresor del árbol de decisión Aprendizaje conjunto: Ensacado (agregación Bootstrap) Bosque aleatorio árboles adicionales Impulsando AdaBoost XGBoost gatoboost Máquinas de aumento de gradiente (GBM) Luz GBM Apilado Modelo generativo Bayes ingenuo Bayes ingenuo gaussiano Bayes ingenuo multinomial Bernoulli ingenuo Bayes Procesos gaussianos Regresión del proceso gaussiano (GPR) Clasificación de procesos gaussianos (GPC) Análisis discriminante gaussiano Análisis discriminante lineal (LDA) Análisis discriminante cuadrático (QDA) Redes de creencias bayesianas Modelos ocultos de Markov (HMM) Pronóstico de series temporales: Visualización y análisis de series temporales: Componentes de las series temporales: tendencia, estacionalidad y ruido Técnicas de descomposición de series temporales Ajuste y diferenciación estacional Autocorrelación y funciones de autocorrelación parcial Prueba Dickey-Fuller aumentada Descomposición estacional de series temporales (descomposición STL) Metodología Box-Jenkins para modelos ARIMA Algoritmos de pronóstico de series temporales: Media móvil (MA) y media móvil ponderada Métodos de suavizado exponencial (simple, doble y triple) Modelos autorregresivos (AR) Modelos de media móvil (MA) Modelos de media móvil integrada autorregresiva (ARIMA) Descomposición estacional de series temporales por Loess (STL) Modelos de media móvil integrada autorregresiva estacional (SARIMA) Modelos ARIMAX y SARIMAX Técnica de reducción de dimensionalidad supervisada: Análisis discriminante lineal (LDA) Algunos de los algoritmos de aprendizaje automático supervisados se pueden utilizar tanto para clasificación como para regresión con una pequeña modificación. Algoritmos multiclase y multisalida: Clasificación multiclase Clasificador OneVsRest Clasificación multietiqueta Regresión multisalida Métricas para algoritmos de clasificación y regresión: Métricas de regresión: Error cuadrático medio (MSE) Error cuadrático medio (RMSE) Error absoluto medio (MAE) R-cuadrado R cuadrado ajustado Métricas de clasificación: Matriz de confusión Precisión Recordar Especificidad puntuación F1 Área bajo la curva ROC (AUC-ROC) Calibración de probabilidad Curvas de calibración Calibrar un clasificador Técnica de validación cruzada: Validación cruzada K-fold Validación cruzada estratificada de k-Fold Validación cruzada de dejar uno fuera Validación cruzada dividida aleatoriamente Validación cruzada de series temporales Técnica de optimización: Descenso de gradiente Descenso del gradiente estocástico Descenso de gradiente de mini lotes Descenso de gradiente basado en impulso Técnicas de optimización basadas en Newton algoritmo de newton Métodos cuasi-Newton (BFGS, L-BFGS) Gradiente conjugado Técnicas de optimización de búsqueda local Montañismo Búsqueda tabú

Algoritmos de aprendizaje automático supervisados

Modelo lineal:
- Regresión
  - Regresión de mínimos cuadrados ordinarios
  - Regresión lineal simple
  - Regresión lineal múltiple
  - Regresión polinomial
  - Persecución de emparejamiento ortogonal (OMP)
  - Regresión bayesiana
  - Regresión cuantil
  - regresión isotónica
  - Regresión paso a paso
  - Regresión de ángulo mínimo (LARS)
- Clasificación:
  - Regresión logística
    - Funciones sigmoideas y Softmax
- Regularización :
  - Lazo (regularización L1)
  - Cresta (regularización L2)
    - Regresión de cresta
    - Clasificador de crestas
  - Red elástica
  - LARS Lazo
K-Vecinos más cercanos (KNN):
- Algoritmos de fuerza bruta
- Algoritmos de árbol de bolas y árbol KD
- Clasificador K-Vecinos más cercanos (KNN)
- Regresor K-vecinos más cercanos (KNN)
Máquinas de vectores de soporte:
- Regresor de máquinas de vectores de soporte
- Diferentes funciones del kernel en SVM
Descenso del gradiente estocástico
- Clasificador de descenso de gradiente estocástico
- Regresor de descenso de gradiente estocástico
- Diferentes funciones de pérdida en SGD
Árbol de decisión:
- Algoritmos de árbol de decisión
  - Algoritmos iterativos del dicotomizador 3 (ID3)
  - C5. Algoritmos
  - Algoritmos de clasificación y árboles de regresión
- Clasificador de árbol de decisión
- Regresor del árbol de decisión
Aprendizaje conjunto:
- Ensacado (agregación Bootstrap)
  - Bosque aleatorio
  - árboles adicionales
- Impulsando
  - AdaBoost
  - XGBoost
  - gatoboost
  - Máquinas de aumento de gradiente (GBM)
  - Luz GBM
- Apilado
Modelo generativo
- Bayes ingenuo
  - Bayes ingenuo gaussiano
  - Bayes ingenuo multinomial
  - Bernoulli ingenuo Bayes
- Procesos gaussianos
  - Regresión del proceso gaussiano (GPR)
  - Clasificación de procesos gaussianos (GPC)
- Análisis discriminante gaussiano
  - Análisis discriminante lineal (LDA)
  - Análisis discriminante cuadrático (QDA)
- Redes de creencias bayesianas
- Modelos ocultos de Markov (HMM)
Pronóstico de series temporales:
- Visualización y análisis de series temporales:
  - Componentes de las series temporales: tendencia, estacionalidad y ruido
  - Técnicas de descomposición de series temporales
  - Ajuste y diferenciación estacional
  - Autocorrelación y funciones de autocorrelación parcial
  - Prueba Dickey-Fuller aumentada
  - Descomposición estacional de series temporales (descomposición STL)
  - Metodología Box-Jenkins para modelos ARIMA
- Algoritmos de pronóstico de series temporales:
  - Media móvil (MA) y media móvil ponderada
  - Métodos de suavizado exponencial (simple, doble y triple)
  - Modelos autorregresivos (AR)
  - Modelos de media móvil (MA)
  - Modelos de media móvil integrada autorregresiva (ARIMA)
  - Descomposición estacional de series temporales por Loess (STL)
  - Modelos de media móvil integrada autorregresiva estacional (SARIMA)
  - Modelos ARIMAX y SARIMAX
Técnica de reducción de dimensionalidad supervisada:
- Análisis discriminante lineal (LDA)

Algunos de los algoritmos de aprendizaje automático supervisados se pueden utilizar tanto para clasificación como para regresión con una pequeña modificación.

Algoritmos multiclase y multisalida:
- Clasificación multiclase
  - Clasificador OneVsRest
- Clasificación multietiqueta
- Regresión multisalida

Métricas para algoritmos de clasificación y regresión:

Métricas de regresión:
- Error cuadrático medio (MSE)
- Error cuadrático medio (RMSE)
- Error absoluto medio (MAE)
- R-cuadrado
- R cuadrado ajustado
Métricas de clasificación:
- Matriz de confusión
- Precisión
- Recordar
- Especificidad
- puntuación F1
- Área bajo la curva ROC (AUC-ROC)
Calibración de probabilidad
- Curvas de calibración
- Calibrar un clasificador

Técnica de validación cruzada:

Validación cruzada K-fold
Validación cruzada estratificada de k-Fold
Validación cruzada de dejar uno fuera
Validación cruzada dividida aleatoriamente
Validación cruzada de series temporales

Técnica de optimización:

Descenso de gradiente
- Descenso del gradiente estocástico
- Descenso de gradiente de mini lotes
- Descenso de gradiente basado en impulso
Técnicas de optimización basadas en Newton
- algoritmo de newton
- Métodos cuasi-Newton (BFGS, L-BFGS)
- Gradiente conjugado
Técnicas de optimización de búsqueda local
- Montañismo
- Búsqueda tabú

2. Algoritmo de aprendizaje no supervisado

Aprendizaje sin supervisión es un tipo de algoritmos de aprendizaje automático en el que los algoritmos se utilizan para encontrar patrones, estructuras o relaciones dentro de un conjunto de datos utilizando un conjunto de datos sin etiquetar. Explora la estructura inherente de los datos sin categorías o etiquetas predefinidas.

Algoritmos de aprendizaje automático no supervisados
Agrupación Métodos basados en centroides Agrupación de K-medias Agrupación K-Means ++ Agrupación en modo K Agrupación difusa de medias C (FCM) Métodos basados en distribución Modelos de mezcla gaussiana (GMM) Algoritmos de maximización de expectativas Modelos de mezcla del proceso Dirichlet (DPMM) Métodos basados en conectividad Agrupación jerárquica Agrupación aglomerativa Agrupación divisiva Propagación por afinidad Métodos basados en densidad DBSCAN (agrupación espacial de aplicaciones con ruido basada en densidad) ÓPTICA (Ordenación de puntos para identificar la estructura de agrupación) Minería de reglas de asociación Algoritmo a priori FP-Crecimiento (Patrón-Crecimiento Frecuente) ECLAT (agrupación de clases de equivalencia y recorrido de celosía ascendente) Detección de anomalías: Puntuación Z Factor de valores atípicos locales (LOF) Bosque de aislamiento Técnica de reducción de dimensionalidad: Análisis de Componentes Principales (PCA) Incrustación de vecinos estocásticos distribuidos en t (t-SNE) Factorización matricial no negativa (NMF) Análisis de componentes independientes (ICA) Análisis factorial Asignación latente de Dirichlet (LDA) isomapa Incrustación localmente lineal (LLE) Análisis Semántico Latente (LSA)

Algoritmos de aprendizaje automático no supervisados

Agrupación
- Métodos basados en centroides
  - Agrupación de K-medias
  - Agrupación K-Means ++
  - Agrupación en modo K
  - Agrupación difusa de medias C (FCM)
- Métodos basados en distribución
  - Modelos de mezcla gaussiana (GMM)
  - Algoritmos de maximización de expectativas
  - Modelos de mezcla del proceso Dirichlet (DPMM)
- Métodos basados en conectividad
  - Agrupación jerárquica
    - Agrupación aglomerativa
    - Agrupación divisiva
  - Propagación por afinidad
- Métodos basados en densidad
  - DBSCAN (agrupación espacial de aplicaciones con ruido basada en densidad)
  - ÓPTICA (Ordenación de puntos para identificar la estructura de agrupación)
Minería de reglas de asociación
- Algoritmo a priori
- FP-Crecimiento (Patrón-Crecimiento Frecuente)
- ECLAT (agrupación de clases de equivalencia y recorrido de celosía ascendente)
Detección de anomalías:
- Puntuación Z
- Factor de valores atípicos locales (LOF)
- Bosque de aislamiento
Técnica de reducción de dimensionalidad:
- Análisis de Componentes Principales (PCA)
- Incrustación de vecinos estocásticos distribuidos en t (t-SNE)
- Factorización matricial no negativa (NMF)
- Análisis de componentes independientes (ICA)
- Análisis factorial
- Asignación latente de Dirichlet (LDA)
- isomapa
- Incrustación localmente lineal (LLE)
- Análisis Semántico Latente (LSA)

3. Aprendizaje por refuerzo

Aprendizaje reforzado Es un tipo de algoritmos de aprendizaje automático donde un agente aprende a tomar decisiones sucesivas interactuando con su entorno. El agente recibe la retroalimentación en forma de incentivos o castigos en función de sus acciones. El propósito del agente es descubrir tácticas óptimas que maximicen las recompensas acumuladas a lo largo del tiempo mediante prueba y error. El aprendizaje por refuerzo se emplea con frecuencia en escenarios en los que el agente debe aprender a navegar en un entorno, jugar, gestionar robots o emitir juicios en situaciones inciertas.

Aprendizaje reforzado
Métodos basados en modelos: Procesos de decisión de Markov (MDP) ecuación de Bellman Algoritmo de iteración de valor Búsqueda de árboles de Montecarlo Métodos sin modelos: Métodos basados en valores: Q-aprendizaje SALSA Monte Carlo Methods Métodos basados en políticas: Algoritmo de refuerzo Algoritmo actor-crítico Métodos actor-crítico Ventaja asincrónica actor-crítico (A3C)

Aprendizaje reforzado

Métodos basados en modelos:
- Procesos de decisión de Markov (MDP)
- ecuación de Bellman
- Algoritmo de iteración de valor
- Búsqueda de árboles de Montecarlo
Métodos sin modelos:
- Métodos basados en valores:
  - Q-aprendizaje
  - SALSA
  - Monte Carlo Methods
- Métodos basados en políticas:
  - Algoritmo de refuerzo
  - Algoritmo actor-crítico
- Métodos actor-crítico
  - Ventaja asincrónica actor-crítico (A3C)

Lista de algoritmos populares de aprendizaje automático

Aquí hay una lista de los 10 algoritmos de aprendizaje automático más populares.

1. Regresión lineal

La regresión lineal es un algoritmo simple que se utiliza para mapear la relación lineal entre las características de entrada y una variable objetivo continua. Funciona ajustando una línea a los datos y luego usando la línea para predecir nuevos valores.

2. Regresión logística

La regresión logística es una extensión de la regresión lineal que se utiliza en tareas de clasificación para estimar la probabilidad de que una instancia pertenezca a una clase específica.

3. SVM (máquina de vectores de soporte)

Las SVM son algoritmos de aprendizaje supervisados que pueden realizar tareas de clasificación y regresión. Encuentra el hiperplano que separa mejor las clases en el espacio de características.

4. KNN (K-vecino más cercano)

KNN es una técnica no paramétrica que se puede utilizar tanto para clasificación como para regresión. Funciona identificando los k puntos de datos más similares a un nuevo punto de datos y luego prediciendo la etiqueta del nuevo punto de datos utilizando las etiquetas de esos puntos de datos.

5. Árbol de decisión

Los árboles de decisión son un tipo de técnica de aprendizaje supervisado que se puede utilizar tanto para clasificación como para regresión. Opera segmentando los datos en grupos cada vez más pequeños hasta que cada grupo pueda clasificarse o predecirse con un alto grado de precisión.

c booleano

6. Bosque aleatorio

Los bosques aleatorios son un tipo de método de aprendizaje conjunto que emplea un conjunto de árboles de decisión para realizar predicciones agregando predicciones de árboles individuales. Mejora la precisión y la resistencia de los árboles de decisión única. Se puede utilizar tanto para tareas de clasificación como de regresión.

7. Bayes ingenuo

Naive Bayes es un clasificador probabilístico basado en el teorema de Bayes que se utiliza para tareas de clasificación. Funciona asumiendo que las características de un punto de datos son independientes entre sí.

8. PCA (Análisis de componentes principales)

PCA es una técnica de reducción de dimensionalidad que se utiliza para transformar datos en un espacio de dimensiones inferiores manteniendo la mayor variación posible. Funciona encontrando las direcciones en los datos que contienen la mayor variación y luego proyectando los datos en esas direcciones.

9. Algoritmos a priori

El algoritmo a priori es una técnica tradicional de minería de datos para la minería de reglas de asociación en bases de datos o conjuntos de datos transaccionales. Está diseñado para descubrir vínculos y patrones entre cosas que ocurren regularmente en las transacciones. Apriori detecta conjuntos de elementos frecuentes, que son grupos de elementos que aparecen juntos en transacciones con un nivel mínimo de soporte determinado.

10. Agrupación de K-medias

La agrupación de K-Means es un enfoque de aprendizaje no supervisado que se puede utilizar para agrupar puntos de datos. Funciona encontrando k grupos en los datos para que los puntos de datos de cada grupo sean lo más similares entre sí posible y al mismo tiempo permanezcan lo más distintos posible de los puntos de datos de otros grupos.

Descubra los conceptos fundamentales que impulsan el aprendizaje automático aprendiendo las 10 algoritmos principales , como regresión lineal, árboles de decisión y redes neuronales.

Algoritmo de aprendizaje automático: preguntas frecuentes

1. ¿Qué es un algoritmo en Machine Learning?

Algoritmos de aprendizaje automático Son técnicas basadas en conceptos estadísticos que permiten a las computadoras aprender de los datos, descubrir patrones, hacer predicciones o completar tareas sin necesidad de programación explícita. Estos algoritmos se clasifican ampliamente en tres tipos, es decir, aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo.

2. ¿Cuáles son los tipos de aprendizaje automático?

Existen principalmente tres tipos de aprendizaje automático:

Algoritmo supervisado

Algoritmo no supervisado

Algoritmo de refuerzo

3. ¿Qué algoritmo de ML es mejor para la predicción?

El método de aprendizaje automático ideal para la predicción está determinado por un número de criterios , incluida la naturaleza del problema, el tipo de datos y los requisitos únicos. Los enfoques de máquinas de vectores de soporte, bosques aleatorios y aumento de gradiente son populares para cargas de trabajo de predicción. La selección de un algoritmo, por otro lado, debe basarse en pruebas y evaluación del problema específico y del conjunto de datos en cuestión.

4. ¿Cuáles son los 10 algoritmos de aprendizaje automático más populares?

A continuación se muestra la lista de los 10 algoritmos de aprendizaje automático (ML) más utilizados:

Regresión lineal

Regresión logística

SVM (máquina de vectores de soporte)

KNN (K-vecino más cercano)

Árbol de decisión

Bosque aleatorio

Bayes ingenuo

PCA (Análisis de Componentes Principales)

Algoritmos a priori

Agrupación de K-medias