encontramos con este hilo, mientras trata de resolver tanto el mismo problema.Había concatenado varios archivos que contenían contraseñas, así que, naturalmente, había muchos dobles. Además, muchos personajes no estándar. Realmente no los necesitaba ordenados, pero parecía que iba a ser necesario para uniq.
me trataron:
sort /Users/me/Documents/file.txt | uniq -u
sort: string comparison failed: Illegal byte sequence
sort: Set LC_ALL='C' to work around the problem.
sort: The strings compared were `t\203tonnement' and `t\203tonner'
intentado:
sort -u /Users/me/Documents/file.txt >> /Users/me/Documents/file2.txt
sort: string comparison failed: Illegal byte sequence
sort: Set LC_ALL='C' to work around the problem.
sort: The strings compared were `t\203tonnement' and `t\203tonner'.
e incluso trató de pasarla a través de gato en primer lugar, sólo para poder ver si nos iban a dar una entrada adecuada.
cat /Users/me/Documents/file.txt | sort | uniq -u > /Users/me/Documents/file2.txt
sort: string comparison failed: Illegal byte sequence
sort: Set LC_ALL='C' to work around the problem.
sort: The strings compared were `zon\351s' and `zoologie'.
No estoy seguro de qué está pasando. Las cadenas "t \ 203tonnement" y "t \ 203tonner" no se encuentran en el archivo, aunque se encuentran "t/203" y "tonnement", pero en líneas separadas que no están contiguas. Lo mismo con "zon \ 351s".
Lo que finalmente funcionó para mí fue:
awk '!x[$0]++' /Users/me/Documents/file.txt > /Users/me/Documents/file2.txt
It palabras también conservados cuya única diferencia era el caso, que es lo que quería. No necesité la lista ordenada, por lo que estaba bien que no fuera así.
¿Desea que las palabras sean únicas en línea o en todo el archivo? Además, ¿desea mantener el orden original de las palabras, o está contento si se cambia el orden? – Beano
necesito las palabras únicas en todo el archivo. el orden de las palabras no es importante. – cupakob
Vea también: [¿Cómo puedo encontrar palabras repetidas en un archivo usando grep/egrep?] (Http://stackoverflow.com/q/33396629/562769) –