Estoy tratando de armar un plan de estudios de matemáticas autodirigido para prepararme para el aprendizaje de minería de datos y aprendizaje automático. Esto está motivado por comenzar la clase de aprendizaje automático de Andrew Ng en Coursera y sentir que antes de continuar necesitaba mejorar mis habilidades matemáticas. Me gradué de la universidad hace un tiempo, así que mi álgebra y estadísticas (específicamente de las clases de ciencias políticas / psicología) están oxidadas.
Las respuestas en el hilo ¿Es una experiencia sólida en matemáticas un requisito total para el aprendizaje automático? solo sugiera libros o clases directamente relacionados con el aprendizaje automático; Ya he examinado algunas de esas clases y libros y no sé exactamente qué materia matemática estudiar (por ejemplo: ¿qué campo (s) de dirección matemática deriva una ecuación para "minimizar una función de costo"?). El otro hilo sugerido ( Habilidades y cursos necesarios para ser un analista de datos ) solo menciona amplias categorías de habilidades necesarias para analizar datos. El hilo Introducción a las estadísticas para matemáticos no se aplica porque todavía no tengo un título en matemáticas; un hilo similar matemático quiere el conocimiento equivalente a un grado de estadísticas de calidad tiene una lista increíble de libros de estadísticas, pero de nuevo, estoy buscando comenzar las matemáticas a partir de un recuerdo oxidado de álgebra y avanzar desde allí.
Entonces, para aquellos que trabajan en el aprendizaje automático y la minería de datos, ¿qué campos de las matemáticas les parecen esenciales para hacer su trabajo? ¿Qué asignaturas de matemáticas sugeriría preparar para la minería de datos y el aprendizaje automático, y en qué orden? Aquí está la lista y el orden que tengo hasta ahora:
- Álgebra
- Precálculo
- Cálculo
- Álgebra lineal
- Probabilidad
- Estadísticas (muchos subcampos diferentes aquí, pero no sé cómo separarlos)
En cuanto a la minería de datos y el aprendizaje automático, a través de mi trabajo actual tengo acceso a registros sobre la actividad del sitio web / aplicación, transacciones de clientes / suscripciones y datos inmobiliarios (tanto estáticos como de series temporales). Espero aplicar la minería de datos y el aprendizaje automático a estos conjuntos de datos.
¡Gracias!
EDITAR:
Por el bien de la posteridad, quería compartir una útil autoevaluación matemática para la clase de Introducción al aprendizaje automático de Geoffrey Gordon / Alex Smola en CMU.