Tengo un archivo CSV y quiero descartar un par de columnas. Así que digamos que este es un archivo de muestra:
column a, column b, column c
value a, value b, value c
value a, "quoted, b", value c
Y ahora digamos que querríamos descartar la columna b, para que el resultado sea:
column a, column c
value a, value c
value a, value c
Si no hubiera la cadena entre comillas "quoated, b" podría hacer esto con cut
:
cut -d ',' -f 1,3
Sin embargo, hay esta cadena entre comillas. Simplemente podría cargar el archivo con libreoffice, pero además de ser menos geniales y automatizables, mis archivos tienen varios cientos de MB y algunos incluso superan el número máximo de filas para LibreOffice Calc.
(Nota al margen: Mis archivos reales tienen más de 30 columnas y me gustaría seleccionar entre 5 y 10 columnas de esas. Así que no es como "descartar la última columna")
sudo apt install python3-csvkit
.