Soy un recién llegado al aprendizaje automático (también algunas estadísticas), he estado aprendiendo conocimiento (algoritmos de aprendizaje supervisados / no supervisados, métodos de optimización relevantes, regularizaciones, algunas filosofías (como el equilibrio de sesgo-varianza)) por un tiempo. Sé que sin ninguna práctica real, no obtendría una comprensión profunda de esas cosas de aprendizaje automático.
Entonces comienzo con algún problema de clasificación con datos reales, digamos clasificación de dígitos escritos a mano (MNIST). Para mi sorpresa, sin ninguna característica de aprendizaje / ingeniería , la precisión alcanza 0.97 usando un clasificador de bosque aleatorio con valores de píxeles sin procesar como entrada. También probé otros algoritmos de aprendizaje, como SVM, LR con parámetros que se están ajustando.
Luego me perdí, ¿sería demasiado fácil o me estoy perdiendo algo aquí? Simplemente seleccione un algoritmo de aprendizaje del kit de herramientas y ajuste algunos parámetros.
Si eso fuera todo sobre el aprendizaje automático en la práctica, estaría perdiendo mi interés en este campo. Pensé y leí algunos blogs durante unos días, y llegué a algunas conclusiones:
La parte más importante del aprendizaje automático en la práctica es la ingeniería de características , es decir, dada la información, encontrar una mejor representación de las características.
Qué algoritmo de aprendizaje usar también es importante, también el ajuste de parámetros, pero la elección final es más sobre experimentación.
No estoy seguro de entenderlo correctamente, esperando que alguien pueda corregirme y darme alguna sugerencia sobre el aprendizaje automático en la práctica.