Saltar al contenido

5 tipos de aprendizaje automático con ejemplos | de Arun Rajendran | marzo de 2023

18 de marzo de 2023

Foto de Markus Spiske en Unsplash

METROEl aprendizaje automático es un campo que se centra en el desarrollo de algoritmos que permiten a las computadoras aprender de los datos y mejorar su desempeño en una tarea específica sin ser programados explícitamente. En otras palabras, el aprendizaje automático se trata de crear algoritmos que puedan aprender de los datos, reconocer patrones y hacer predicciones basadas en esos datos. Para aprender y comprender los diferentes algoritmos de aprendizaje automático, es vital comprender los diferentes tipos de aprendizaje automático.

Hay tres tipos principales de aprendizaje automático, a saber, aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo. Además de estos, también hay otras dos categorías, a saber, aprendizaje semisupervisado y activo. Comprendamos estas 5 categorías diferentes de aprendizaje automático en este artículo.

El aprendizaje supervisado es un tipo de aprendizaje automático en el que la computadora recibe datos etiquetados y un conjunto de reglas a seguir. El objetivo es hacer predicciones basadas en los datos etiquetados. Los datos etiquetados se usan para entrenar un modelo, y el modelo entrenado luego se usa para hacer predicciones sobre datos nuevos e invisibles.

Hay dos tipos principales de aprendizaje supervisado:

Clasificación:

donde el objetivo es predecir una etiqueta categórica (es decir, una etiqueta que pertenece a un conjunto predefinido) en función de las características de entrada.

Ejemplo de clasificación:
Un ejemplo clásico de clasificación es la detección de spam. Dado un conjunto de correos electrónicos etiquetados (spam o no spam), se puede entrenar un modelo para clasificar nuevos correos electrónicos como spam o no spam.

Fórmulas matemáticas para la clasificación:
El algoritmo de aprendizaje supervisado para problemas de clasificación suele adoptar la forma de distribuciones de probabilidad. Uno de los algoritmos más populares para este problema es la regresión logística. El algoritmo se representa mediante la siguiente fórmula:
P(Y=1|X)= 1/(1+ e^(-wX -b))

Aquí, Y es el valor binario predicho, b es la matriz de sesgo, X es la matriz de características de entrada y w es la matriz de ponderación.

Regresión: donde el objetivo es predecir un valor continuo (por ejemplo, un precio, un peso, una temperatura) en función de las características de entrada.

Ejemplo de regresión:
Un ejemplo clásico de regresión es predecir el precio de una casa en función de su tamaño, ubicación y otros factores.

Fórmulas matemáticas para la regresión:


El algoritmo de aprendizaje supervisado para problemas de regresión suele adoptar la forma de ecuaciones lineales o polinómicas. Uno de los algoritmos más populares para este problema es la regresión lineal. El algoritmo se representa mediante la siguiente fórmula:

Y = b + w1x1 + w2x2 + … + wn*xn.

Aquí, Y es el valor predicho, b es el término de sesgo, x1,x2…xn son las características de entrada y w1,w2…wn son los pesos.

El aprendizaje no supervisado es un tipo de aprendizaje automático en el que la computadora recibe datos sin etiquetar y debe encontrar patrones y relaciones por sí misma. En este tipo de aprendizaje, el algoritmo no recibe la salida correcta, sino que tiene que encontrar patrones y relaciones en los datos por sí mismo. El objetivo principal del aprendizaje no supervisado es descubrir estructuras ocultas en los datos.

Hay dos tipos principales de aprendizaje no supervisado:

Agrupación: donde el objetivo es agrupar puntos de datos similares.

Ejemplo de agrupamiento:


Un ejemplo clásico de agrupamiento es la segmentación de clientes. Dado un conjunto de datos de información del cliente (edad, ingresos, ubicación, etc.), se puede usar un algoritmo de agrupación para agrupar a los clientes con características similares.

Fórmulas matemáticas para la agrupación:
Uno de los algoritmos más populares para este problema es k-means. El algoritmo se representa mediante la siguiente fórmula:
minimizar ∑i=1 a k ∑x pertenece a C(i) ||xu(i)||²

Aquí, C(i) es el conjunto de puntos de datos que pertenecen al grupo i, u(i) es el centroide del grupo i y k es el número de grupos.

Reducción de dimensionalidad:

donde el objetivo es reducir la cantidad de características en los datos mientras se retiene la mayor cantidad de información posible.

Ejemplo de reducción de dimensionalidad:
Un ejemplo clásico de reducción de dimensionalidad es la compresión de imágenes. Dada una imagen de alta resolución, se puede usar un algoritmo de reducción de dimensionalidad para reducir la cantidad de píxeles mientras se retiene la mayor cantidad de información posible.

Fórmulas matemáticas para la reducción de dimensionalidad:
Uno de los algoritmos más populares para este problema es el análisis de componentes principales (PCA). PCA es una técnica lineal que encuentra las direcciones (componentes principales) en los datos que representan la mayor variación. El algoritmo se representa mediante la siguiente fórmula:
X = WY

Aquí, X son los datos originales, Y son los datos transformados y W es la matriz de transformación.

El aprendizaje por refuerzo (RL) es un tipo de aprendizaje automático en el que la computadora aprende interactuando con su entorno y recibiendo retroalimentación en forma de recompensas o castigos. El objetivo de RL es aprender una política que maximice la recompensa acumulada a lo largo del tiempo. En RL, un agente interactúa con un entorno y aprende a realizar acciones que maximizarán la recompensa acumulativa que recibe del entorno. El agente aprende por ensayo y error, ajustando sus acciones en función de las recompensas que recibe.

Ejemplo de aprendizaje por refuerzo:
Un ejemplo clásico de RL es enseñar a un robot a navegar hasta una ubicación objetivo. El robot se coloca en un entorno y aprende a navegar hasta la ubicación objetivo al recibir recompensas (positivas o negativas) en función de sus acciones (por ejemplo, avanzar, girar a la izquierda, etc.).

Fórmulas matemáticas:


El algoritmo de aprendizaje por refuerzo se representa mediante la siguiente fórmula:
Q(s,a) = Q(s,a) + α(r + γmáxa’ Q(s’,a’) – Q(s,a))

Aquí, Q(s,a) es la recompensa acumulada esperada por realizar la acción a en el estado s y luego seguir la política óptima a partir de entonces, α es la tasa de aprendizaje, r es la recompensa inmediata recibida después de realizar la acción a en el estado s, γ es el factor de descuento y maxa’ Q(s’,a’) es la máxima recompensa acumulada esperada que se puede lograr del siguiente estado s’ siguiendo cualquier acción a’.

El algoritmo de aprendizaje por refuerzo también se representa mediante la siguiente fórmula:
π(s) = argmaxa Q(s,a)

Aquí, π(s) es la función de política, que es un mapeo de estados a acciones, y argmaxa Q(s,a) representa la acción que maximiza la recompensa acumulada esperada.

El aprendizaje semisupervisado es un tipo de aprendizaje automático que se encuentra entre el aprendizaje supervisado y el no supervisado. En el aprendizaje semisupervisado, el algoritmo cuenta con algunos datos etiquetados y algunos datos no etiquetados. El objetivo es utilizar los datos etiquetados para hacer predicciones sobre los datos no etiquetados. Este enfoque es útil cuando los datos etiquetados son escasos y costosos de adquirir.

Usos del aprendizaje semisupervisado:

En el procesamiento del lenguaje natural, cuando hay una gran cantidad de texto disponible, pero solo una pequeña parte está etiquetada, se puede usar un algoritmo de aprendizaje semisupervisado para clasificar los datos no etiquetados.
En la visión artificial, cuando se dispone de un gran conjunto de datos de imágenes, pero solo una pequeña parte de ellas están etiquetadas, se puede utilizar un algoritmo de aprendizaje semisupervisado para clasificar las imágenes no etiquetadas.

Los algoritmos de aprendizaje semisupervisados ​​suelen ser una combinación de algoritmos de aprendizaje supervisados ​​y no supervisados. Uno de los algoritmos más populares para este problema es Auto-entrenamiento. Este algoritmo se representa mediante el siguiente procedimiento:

  1. Entrenar un modelo usando datos etiquetados
  2. Use el modelo entrenado para predecir etiquetas en los datos sin etiquetar
  3. Agregue los datos pronosticados con mayor confianza al conjunto de datos etiquetados
  4. Repita los pasos 1 a 3 hasta alcanzar la precisión deseada

Otro algoritmo que se utiliza en el aprendizaje semisupervisado es co-entrenamiento

. Los modelos para este algoritmo se entrenan de la siguiente manera:

  1. Entrene dos modelos de forma independiente usando datos etiquetados
  2. Utilice los modelos para predecir etiquetas en los datos sin etiquetar
  3. Combine las predicciones y agregue los datos pronosticados con mayor confianza al conjunto de datos etiquetados
  4. Repita los pasos 1 a 3 hasta alcanzar la precisión deseada

En ambos casos, los modelos utilizados para el aprendizaje semisupervisado pueden ser cualquier modelo de aprendizaje supervisado como regresión logística, árbol de decisión, etc. La fórmula matemática específica para estos modelos dependerá del modelo utilizado.

El aprendizaje activo es un tipo de aprendizaje automático que permite que el algoritmo seleccione activamente los datos de los que quiere aprender. En el aprendizaje activo, el algoritmo puede consultar al usuario humano para obtener etiquetas para instancias específicas con el fin de mejorar su rendimiento. El aprendizaje activo es particularmente útil en situaciones donde los datos etiquetados son escasos y costosos de adquirir. Al seleccionar activamente las instancias de las que aprender, el algoritmo puede mejorar su rendimiento con un conjunto de datos etiquetados más pequeño.

Usos del aprendizaje activo:

En el procesamiento del lenguaje natural, cuando hay una gran cantidad de texto disponible, pero solo una pequeña parte está etiquetada, se puede usar un algoritmo de aprendizaje activo para consultar al usuario humano sobre etiquetas en instancias específicas, a fin de mejorar su rendimiento.
En la visión por computadora, cuando hay disponible un gran conjunto de datos de imágenes, pero solo una pequeña parte de ellas está etiquetada, se puede usar un algoritmo de aprendizaje activo para consultar al usuario humano sobre etiquetas en instancias específicas, a fin de mejorar su rendimiento.

Fórmulas matemáticas:


Los algoritmos de aprendizaje activo suelen implicar una combinación de algoritmos de aprendizaje supervisados ​​y no supervisados. Uno de los algoritmos más populares para este problema es muestreo de incertidumbre. El procedimiento de entrenamiento para esto es el siguiente:

  1. Entrenar un modelo usando datos etiquetados
  2. Use el modelo entrenado para predecir etiquetas en los datos sin etiquetar
  3. Seleccione instancias con el puntaje de incertidumbre más alto y consulte al usuario humano por sus etiquetas
  4. Agregar las nuevas instancias etiquetadas al conjunto de datos etiquetado
  5. Repita los pasos 1 a 4 hasta alcanzar la precisión deseada

Aquí, la puntuación de incertidumbre se puede calcular utilizando diferentes métodos, como la entropía, el margen y otros. La fórmula matemática específica para estos métodos dependerá del método utilizado.

Otro algoritmo que se utiliza en el aprendizaje activo es consulta por comité. Se implementa de la siguiente manera:

  1. Entrene múltiples modelos usando datos etiquetados
  2. Utilice los modelos para predecir etiquetas en los datos sin etiquetar
  3. Seleccione instancias en las que los modelos no estén de acuerdo y consulte al usuario humano por sus etiquetas
  4. Agregar las nuevas instancias etiquetadas al conjunto de datos etiquetado
  5. Repita los pasos 1 a 4 hasta alcanzar la precisión deseada

En ambos casos, los modelos utilizados para el aprendizaje activo pueden ser cualquier modelo de aprendizaje supervisado como regresión logística, árbol de decisión, etc. La fórmula matemática específica para estos modelos dependerá del modelo utilizado.

Recomendado:  Informe de mercado global de aprendizaje automático 2020: análisis de la industria, tendencias, tamaño del mercado y pronósticos 2018-2026

Top Big Data