En Linux, tengo un directorio con muchos archivos. Algunos de ellos tienen caracteres que no son ASCII, pero todos son válidos UTF-8. Un programa tiene un error que impide que funcione con nombres de archivo que no sean ASCII, y tengo que averiguar cuántos se ven afectados. Iba a hacer esto con find
y luego hacer un grep para imprimir los caracteres que no son ASCII, y luego hacer un wc -l
para encontrar el número. No tiene que ser grep; Puedo utilizar cualquier estándar de Unix regular expression, como Perl, sed, AWK, etc.(grep) Regex para que coincida con caracteres que no sean ASCII?
Sin embargo, hay una expresión regular para 'cualquier carácter que no sea un carácter ASCII'?
está instalado perl? –
Paul, sí puedo usar perl – Rory