Tengo un archivo de texto con una gran cantidad de datos delimitados por tabuladores. Quiero echar un vistazo a los datos para poder ver los valores únicos en una columna. Por ejemplo,¿Cómo contar el número de valores únicos de un campo en un archivo de texto delimitado por tabulaciones?
Red Ball 1 Sold
Blue Bat 5 OnSale
...............
Por lo tanto, es como la primera columna tiene colores, por lo que quieren saber cuántos diferentes valores únicos que hay en la columna y yo quiero ser capaz de hacer eso para cada columna.
Necesito hacer esto en una línea de comandos de Linux, así que probablemente use algunos script bash, sed, awk o algo así.
Addendum: Gracias a todos por la ayuda, ¿puedo pedir una cosa más? ¿Y si también quisiera contar estos valores únicos?
Supongo que no puse la segunda parte con suficiente claridad. Lo que quería hacer es tener un recuento de "cada uno" de estos valores únicos, sin saber cuántos valores únicos hay. Por ejemplo, en la primera columna quiero saber cuántos objetos de colores rojos, azules, verdes, etc. hay allí.
'uniq -c' recuentos por elemento. –
@Dennis gracias, esto es lo que necesitaba. Me gusta mucho lo poderosa pero simple que es realmente la línea de comandos de Linux. Necesito comenzar a aprenderlo correctamente :). – sfactor