A medida que descubro el aprendizaje automático, veo diferentes técnicas interesantes como:
- ajusta automáticamente los algoritmos con técnicas como
grid search
, - obtener resultados más precisos mediante la combinación de diferentes algoritmos del mismo "tipo", es decir
boosting
, - obtener resultados más precisos mediante la combinación de diferentes algoritmos (pero no el mismo tipo de algoritmos), es decir
stacking
, - y probablemente mucho más que aún tengo que descubrir ...
Mi pregunta es la siguiente: hay todas esas piezas. Pero, ¿es posible juntarlos para crear un algoritmo que tome como entrada datos limpios y genere buenos resultados al sacar lo mejor de todas las técnicas? (Por supuesto, probablemente será menos eficiente que un científico de datos profesional, ¡pero será mejor que yo!) En caso afirmativo, ¿tiene códigos de muestra o conoce marcos que puedan hacer eso?
EDITAR: Después de algunas respuestas, parece que hay que hacer algunos ajustes. Tomemos un ejemplo, tenemos una columna con datos categóricos, llamémosla y
y queremos predecirla a partir de datos numéricos X
que sean dummies o datos numéricos reales (altura, temperatura). Asumimos que la limpieza se ha realizado previamente. ¿Existe algún algoritmo que pueda tomar esos datos y generar una predicción? (probando varios algoritmos, ajustándolos, aumentando, etc.) En caso afirmativo, ¿es computacionalmente eficiente (los cálculos se realizan en un tiempo razonable si lo comparamos con el algoritmo normal), y ¿tiene un ejemplo de código?
auto.arima
(desde la forecast
biblioteca) puede ser mejor que los humanos, Rob Hyndman lo mencionó varias veces en sus presentaciones. Por lo tanto, hay áreas donde se aplican con éxito algunos tipos de "aprendizaje automático".