¿Cuál es el límite de escalabilidad razonable de 'sort -u'? (en dimensiones de "longitud de línea", "cantidad de líneas", "tamaño de archivo total"?)
¿Cuál es la alternativa de Unix para archivos que exceden esto en la dimensión de "cantidad de líneas"? (Por supuesto, puedo implementar fácilmente uno, pero me preguntaba si hay algo que se pueda hacer con pocos comandos estándar de Linux).
uniq
antes de las sort -u
ayudas. Por cierto, para los datos ASCII LC_ALL=C sort
, GNU acelera sort
muchísimo (vea esta respuesta )