En el contexto del aprendizaje automático, ¿cuál es la diferencia entre
- aprendizaje sin supervisión
- aprendizaje supervisado y
- aprendizaje semi-supervisado?
¿Y cuáles son algunos de los principales enfoques algorítmicos a considerar?
En el contexto del aprendizaje automático, ¿cuál es la diferencia entre
¿Y cuáles son algunos de los principales enfoques algorítmicos a considerar?
Respuestas:
En general, los problemas del aprendizaje automático pueden considerarse variaciones en la estimación de funciones para la clasificación, predicción o modelado.
En el aprendizaje supervisado, uno está provisto de entrada ( , , ...,) y salida ( , , ...,) y tiene el desafío de encontrar una función que se aproxime a este comportamiento de manera generalizable. El resultado podría ser una etiqueta de clase (en clasificación) o un número real (en regresión); estos son la "supervisión" en el aprendizaje supervisado.
El aprendizaje semi-supervisado implica la estimación de la función en datos etiquetados y no etiquetados. Este enfoque está motivado por el hecho de que los datos etiquetados son a menudo costosos de generar, mientras que los datos no etiquetados generalmente no lo son. El desafío aquí consiste principalmente en la cuestión técnica de cómo tratar los datos mezclados de esta manera. Consulte esta Encuesta de literatura de aprendizaje semi-supervisada para obtener más detalles sobre los métodos de aprendizaje semi-supervisados.
Aprendizaje sin supervisión
El aprendizaje no supervisado es cuando no hay datos etiquetados disponibles para el entrenamiento. Ejemplos de esto son a menudo los métodos de agrupamiento.
Aprendizaje supervisado
En este caso, sus datos de entrenamiento existen fuera de los datos etiquetados. El problema que resuelve aquí a menudo es predecir las etiquetas para los puntos de datos sin etiqueta.
Aprendizaje semi-supervisado
En este caso, se utilizan tanto datos etiquetados como datos no etiquetados. Esto, por ejemplo, se puede usar en redes de creencias profundas, donde algunas capas están aprendiendo la estructura de los datos (sin supervisión) y una capa se usa para hacer la clasificación (entrenada con datos supervisados)
No creo que supervisado / no supervisado sea la mejor manera de pensarlo. Para la minería de datos básica, es mejor pensar en lo que está tratando de hacer. Hay cuatro tareas principales:
predicción. Si está prediciendo un número real, se llama regresión. Si está prediciendo un número entero o una clase, se llama clasificación.
modelado. el modelado es lo mismo que la predicción, pero el modelo es comprensible para los humanos. Las redes neuronales y las máquinas de vectores de soporte funcionan muy bien, pero no producen modelos comprensibles [1]. los árboles de decisión y la regresión lineal clásica son ejemplos de modelos fáciles de entender.
semejanza. Si está tratando de encontrar grupos naturales de atributos, se llama análisis factorial. Si está tratando de encontrar grupos naturales de observaciones, se llama agrupación.
asociación. es muy parecido a la correlación, pero para enormes conjuntos de datos binarios.
[1] Aparentemente, Goldman Sachs creó toneladas de grandes redes neuronales para la predicción, pero luego nadie las entendió, por lo que tuvieron que escribir otros programas para tratar de explicar las redes neuronales.