Mucha gente usa una herramienta principal como Excel u otra hoja de cálculo, SPSS, Stata o R para sus necesidades estadísticas. Pueden recurrir a algún paquete específico para necesidades muy especiales, pero se pueden hacer muchas cosas con una simple hoja de cálculo o un paquete de estadísticas generales o un entorno de programación de estadísticas.
Siempre me ha gustado Python como lenguaje de programación, y para necesidades simples, es fácil escribir un programa corto que calcule lo que necesito. Matplotlib me permite trazarlo.
¿Alguien ha cambiado completamente de, digamos R, a Python? R (o cualquier otro paquete de estadísticas) tiene muchas funciones específicas para las estadísticas, y tiene estructuras de datos que le permiten pensar en las estadísticas que desea realizar y menos en la representación interna de sus datos. Python (o algún otro lenguaje dinámico) tiene el beneficio de permitirme programar en un lenguaje familiar de alto nivel, y me permite interactuar programáticamente con sistemas del mundo real en los que residen los datos o desde los cuales puedo tomar medidas. Pero no he encontrado ningún paquete de Python que me permita expresar cosas con "terminología estadística", desde estadísticas descriptivas simples hasta métodos multivariados más complicados.
¿Qué me puede recomendar si quisiera usar Python como un "banco de trabajo de estadísticas" para reemplazar R, SPSS, etc.?
¿Qué ganaría y perdería, según su experiencia?