Para fines de depuración, necesito buscar recursivamente en un directorio todos los archivos que comienzan con una marca de orden de bytes UTF-8 (BOM). Mi solución actual es un simple script de shell:¿Manera elegante de buscar archivos UTF-8 con BOM?
find -type f |
while read file
do
if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ]
then
echo "found BOM in: $file"
fi
done
O, si lo prefiere, ilegibles cortos de una sola línea:
find -type f|while read file;do [ "`head -c3 -- "$file"`" == $'\xef\xbb\xbf' ] && echo "found BOM in: $file";done
No funciona con nombres de archivo que contienen un salto de línea, pero tales archivos no son de esperar de todos modos.
¿Hay alguna solución más corta o más elegante?
¿Hay editores de texto o macros interesantes para los editores de texto?
Brillante, señor ... gracias! :-) – KyleFarris
Detecta incorrectamente PDF con un marcador BOM ... eso es porque busca todo el documento, no solo la primera línea –
Modifica los archivos binarios ... –