TLDR
La pregunta original no estaba clara, y leía que el OP simplemente quería una versión única del contenido de un archivo. Eso se muestra a continuación. En la forma actualizada de la pregunta, el OP ahora declara que simplemente quiere saber si el contenido del archivo es único o no.
Prueba si el contenido del archivo es único o no
Simplemente puede usar sort
para verificar si un archivo es único o contiene duplicados de esta manera:
$ sort -uC input.txt && echo "unique" || echo "duplicates"
Ejemplo
Digamos que tengo estos dos archivos:
archivo de muestra duplicado
$ cat dup_input.txt
This is a thread 139737522087680
This is a thread 139737513694976
This is a thread 139737505302272
This is a thread 139737312270080
This is a thread 139737203164928
This is a thread 139737194772224
This is a thread 139737186379520
archivo de muestra único
$ cat uniq_input.txt
A
B
C
D
Ahora, cuando analizamos estos archivos, podemos saber si son únicos o si contienen duplicados:
prueba de archivos duplicados
$ sort -uC dup_input.txt && echo "unique" || echo "duplicates"
duplicates
prueba de archivo único
$ sort -uC uniq_input.txt && echo "unique" || echo "duplicates"
unique
Pregunta original (contenido único del archivo)
Se puede hacer con solo sort
:
$ sort -u input.txt
This is a thread 139737186379520
This is a thread 139737194772224
This is a thread 139737203164928
This is a thread 139737312270080
This is a thread 139737505302272
This is a thread 139737513694976
This is a thread 139737522087680