Ambos parecen extremadamente similares y tengo curiosidad sobre qué paquete sería más beneficioso para el análisis de datos financieros.
Ambos parecen extremadamente similares y tengo curiosidad sobre qué paquete sería más beneficioso para el análisis de datos financieros.
Respuestas:
pandas proporciona herramientas de manipulación de datos de alto nivel creadas sobre NumPy. NumPy por sí mismo es una herramienta de nivel bastante bajo, similar a MATLAB. pandas, por otro lado, ofrece una amplia funcionalidad de series de tiempo, alineación de datos, estadísticas amigables para NA, métodos de agrupación, fusión y unión, y muchas otras comodidades. Se ha vuelto muy popular en los últimos años en aplicaciones financieras. Tendré un capítulo dedicado al análisis de datos financieros utilizando pandas en mi próximo libro.
NA-friendly statistics
mencionado en tu respuesta.
Los pandas requieren Numpy (y prácticamente todas las herramientas numéricas para Python). Scipy no es estrictamente necesario para los pandas, pero aparece como una "dependencia opcional". No diría que los pandas son una alternativa a Numpy y / o Scipy. Más bien, es una herramienta adicional que proporciona una forma más ágil de trabajar con datos numéricos y tabulares en Python. Puede usar estructuras de datos de pandas, pero puede utilizar libremente las funciones de Numpy y Scipy para manipularlas.
Los pandas ofrecen una excelente manera de manipular tablas, ya que puede facilitar la agrupación ( agrupando un marco de datos en pandas en Python ) y calcular estadísticas. Otra cosa que es genial en los pandas es la clase Panel que puede unir series de capas con diferentes propiedades y combinarlas usando la función groupby.