Revisé las respuestas en este útil hilo , pero mi problema parece ser lo suficientemente diferente como para no pensar en una buena respuesta (al menos con sed
).
Tengo un archivo CSV grande (más de 200 GB) con filas que se parecen a lo siguiente:
<alphanumerical_identifier>,<number>
donde <alphanumerical_identifier>
es único en todo el archivo. Me gustaría crear un archivo separado que reemplace la primera columna por un índice , es decir
<index>,<number>
para que obtengamos:
1, <number>
2, <number>
3, <number>
¿Puede awk
generar un índice creciente sin cargar el archivo completo en la memoria?
Dado que el índice aumenta monotónicamente, puede ser aún mejor simplemente dejar caer el índice. ¿Sería la solución para eso tan diferente ?, es decir:
<number>
<number>
<number>
awk -F, '{print ++n, $2}'
funcionaría. O awk -F, '{print $2}'
para la segunda variación.
FNR
serviría tan bien como++n