Tengo un archivo txt llamado COPYING que se edita en Windows. Contiene el estilo de Windows eolCómo encontrar y eliminar los caracteres invisibles en el archivo de texto usando emacs
$ file COPYING
COPYING: ASCII English text, with CRLF line terminators
He intentado convertirlo al estilo de Unix con dos2unix. A continuación se muestra la salida
$ dos2unix COPYING
dos2unix: Skipping binary file COPYING
Me sorprendió encontrar que el programa dos2unix lo informa como un archivo binario. Luego, usando algún otro editor (no emacs) encontré que el archivo contiene un caracter de control. Estoy interesado en encontrar todos los personajes invisibles en el archivo usando emacs.
por google he encontrado la siguiente solución que utiliza tr
tr -cd '\11\12\40-\176' < file_name
Cómo hacer la misma en forma de emacs. Probé el modo hexl. El modo hexadecimal muestra el texto y sus valores ascii correspondientes en un solo búfer, lo que es genial. Cómo encontrar los caracteres que tienen valores ASCII distintos de 11-12, 40-176 (es decir, tabulación, espacio y caracteres visibles). Traté de crear una expresión regular para esa búsqueda, pero es bastante complicado.
Gracias por la respuesta. Quería entender lo que hace la expresión regular. Escribí el comando "describe-character-set" y luego seleccioné el "ascii" para ver el conjunto de caracteres. ¿Podría explicar por qué perdió el C-j y dónde el C-? está documentado. –
@Talespin_Kit 'C-i' es una pestaña,' C-j' es nueva línea. – Gilles
Este enlace http://www2.lib.uchicago.edu/keith/tcl-course/emacs-tutorial.html dice que C-m es para la tecla RET. No puedo encontrar el documento donde C-? está documentado. ¿Podrías por favor señalarlo? –