Tengo experiencia en programación de computadoras y teoría elemental de números, pero no tengo entrenamiento en estadísticas reales, y recientemente he "descubierto" que el asombroso mundo de toda una gama de técnicas es en realidad un mundo estadístico. Parece que las factorizaciones de matrices, la terminación de matrices, los tensores de alta dimensión, las incrustaciones, la estimación de densidad, la inferencia bayesiana, las particiones de Markov, el cálculo de vectores propios, el PageRank son técnicas altamente estadísticas, y que los algoritmos de aprendizaje automático que usan tales cosas, usan muchas estadísticas .
Mi objetivo es poder leer documentos que discutan tales cosas e implementar o crear los algoritmos, al tiempo que entiendo la notación, las "pruebas" y los argumentos estadísticos utilizados. Supongo que lo más difícil es seguir todas las pruebas que involucran matrices.
¿Qué documentos básicos pueden ayudarme a comenzar? ¿O un buen libro de texto con ejercicios por los que valga la pena trabajar?
Específicamente, algunos documentos que me gustaría entender completamente son:
- Finalización exacta de la matriz a través de la optimización convexa, Candes, Recht, 2008
- La transformación rápida de Cauchy y la regresión lineal más rápida y robusta, Clarkson et al, 2013
- Proyecciones aleatorias para máquinas de vectores de soporte, Paul et al, 2013
- Estimación de probabilidad de alta dimensión con modelos de densidad profunda, Rippel, Adams, 2013
- Obtención de estimaciones de minimización de errores y límites universales de errores de entrada sabios para la finalización de la matriz de bajo rango, Király, Theran, 2013