Tengo que extraer una columna de datos de un archivo muy grande> 100 GB.
Sé cómo usar los comandos awk
y cut
hacerlo, pero me gustaría saber si uno es más eficiente (desde una perspectiva de velocidad) para tal tarea.
Si
—
Michael Vehrs
cut
se puede usar, debería ser más rápido, ya que es mucho más simple y, por lo tanto, menos capaz.
grep -o "\w*pattern\w*" /path/to/file
. Es posible que desee leer también sobre elparallel
uso de múltiplesgrep
's en fragmentos de ese archivo.