Aprendizaje supervisado
- 1) Un humano construye un clasificador basado en entrada y salida de datos
- 2) Ese clasificador está entrenado con un conjunto de datos de entrenamiento
- 3) Ese clasificador se prueba con un conjunto de datos de prueba
- 4) Despliegue si el resultado es satisfactorio
Para usarse cuando, "Sé cómo clasificar estos datos, solo necesito que usted (el clasificador) los ordene".
Punto de método: clasificar etiquetas o producir números reales
Aprendizaje sin supervisión
- 1) Un humano construye un algoritmo basado en datos de entrada
- 2) Ese algoritmo se prueba con un conjunto de datos de prueba (en el que el algoritmo crea el clasificador)
- 3) Despliegue si el clasificador es satisfactorio
Para usarse cuando, "No tengo idea de cómo clasificar estos datos, ¿puede (el algoritmo) crear un clasificador para mí?"
Punto de método: clasificar etiquetas o predecir (PDF)
Aprendizaje reforzado
- 1) Un humano construye un algoritmo basado en datos de entrada
- 2) Ese algoritmo presenta un estado dependiente de los datos de entrada en el que un usuario recompensa o castiga el algoritmo a través de la acción el algoritmo, esto continúa con el tiempo
- 3) Ese algoritmo aprende de la recompensa / castigo y se actualiza a sí mismo, esto continúa
- 4) Siempre está en producción, necesita aprender datos reales para poder presentar acciones de los estados
Para ser usado cuando, "No tengo idea de cómo clasificar estos datos, ¿puede clasificarlos y le daré una recompensa si es correcta o lo castigaré si no lo es?"
¿Es este el tipo de flujo de estas prácticas, escucho mucho sobre lo que hacen, pero la información práctica y ejemplar es terriblemente escasa!