SQL le permite persistir y hacer muchas transacciones de relación diferentes y siempre tenerlo disponible para múltiples usos diferentes. Esencialmente, una fuente de verdad o lugar a donde ir. Hay sobrecarga de seguro. Sin embargo, algunos análisis pueden ser muy complicados y requieren una cantidad significativa de operaciones basadas en conjuntos que pueden convertir incluso un pequeño conjunto de datos en uno muy rápido. He tenido procesos de datos que tienen más de 2000 consultas que procesan terabytes en menos de 5 minutos y puedo anotar miles de millones de registros para un modelo predictivo al final y python y numpy obtuvieron una fracción del conjunto de datos en 10 veces como un almacén de datos relacionales y servirlo hasta una capa de presentación.
Un punto adicional, si hace esto en la nube, asegúrese de tener una instancia dinámica que pueda escalar su memoria. Con SQL, se trata de tener un disco y un cálculo suficiente para hacerlo de manera oportuna.
Veo muchas formas en que pueden trabajar en sinergia. Muchos trabajos de ciencia de datos son para lo que Pandas fue diseñado para hacer. Algunos trabajos de ciencia de datos son para lo que los RDB fueron diseñados. Use ambos en equilibrio.
Se trata de la herramienta adecuada para hacer el trabajo correcto.