Los comandos que usaremos serán:
- comando wc
- comando sort
- comando cut
-comando uniq
Contar el número de filas en un archivo csv
Usaremos únicamente el comnado:
wc -l archivo.csv
Que nos devolverá el número de filas
Contar el número de registros diferentes en un campo (similar a select count(distinct campo))
Suponemos que queremos ver cuantos registros diferentes del campo3 hay en archivo.csv (separador por tabuladores):
cut -f 3 archivo.csv | sort | uniq | wc -l
Si el archivo usase otro separador por ejemplo la coma ( , ) :
cut -t, -f 3 archivo.csv | sort | uniq | wc -l
Tambien podemos suprimir el comnado uniq:
cut -t, -f 3 archivo.csv | sort -u | wc -l
No hay comentarios:
Publicar un comentario