Estoy cargando un archivo bastante gigantesco en una base de datos postgresql. Para hacer esto, primero lo uso spliten el archivo para obtener archivos más pequeños (30 Gb cada uno) y luego cargo cada archivo más pequeño en la base de datos usando GNU Parallely psql copy.
El problema es que toma aproximadamente 7 horas dividir el archivo y luego comienza a cargar un archivo por núcleo. Lo que necesito es una manera de decirle splitque imprima el nombre del archivo a la salida estándar cada vez que termine de escribir un archivo para poder conectarlo Parallely comience a cargar los archivos en el momento en que splittermine de escribirlo. Algo como esto:
split -l 50000000 2011.psv carga/2011_ | parallel ./carga_postgres.sh {}
He leído las splitpáginas del manual y no puedo encontrar nada. ¿Hay alguna manera de hacer esto con splitalguna otra herramienta?