Necesito almacenar archivos de datos binarios en una base de datos PostgreSQL que se ejecuta en un servidor Ubuntu. Inicialmente habrá unas pocas docenas de archivos de aproximadamente 250 kb de tamaño cada uno. Sin embargo, la cantidad de archivos aumentará con el tiempo. Es posible que a veces necesite extraer datos de los archivos para otros análisis posteriores.
He realizado algunas investigaciones sobre la antigua cuestión de almacenar datos binarios como BLOB o referencias. Ambos obviamente tienen sus pros y sus contras. ¿Hay algún problema específico relacionado con PostgreSQL que deba tener en cuenta? ¿Es preferible un método u otro si deseo extraer datos de los archivos, ya sea a través de una función PostgreSQL o mediante un programa externo de Python?
Si tuviera que almacenar los archivos de datos directamente en la base de datos, ¿sería mejor almacenarlos en una tabla separada con una clave externa que haga referencia a la tabla "principal", en lugar de en la tabla que contiene todos los demás campos?
He leído la pregunta y las respuestas aquí ; un comentario sugiere que es mejor almacenar archivos binarios por referencia (en el sistema de archivos) en Linux. Mis preguntas aquí se relacionan específicamente con PostgreSQL y con la extracción de datos de los archivos para diversos análisis.
Actualización: pregunta similar .