Chip, Dirkland, DrobæSphere Inc, cdirkland @ hotmail.com, EE.UU.Skip/eliminar caracteres no ASCII con sed
que he estado tratando de usar sed para modificar direcciones de correo electrónico en un archivo .csv pero la línea por encima de mí sigue tropezar, usando comandos como:
sed -i 's/[\d128-\d255]//' FILENAME
from this stackoverflow question
no parece funcionar como me sale un error 'no válido carácter de intercalación'.
Idealmente, no quiero cambiar el carácter AE combinado en absoluto, preferiría saltearlo ya que no estoy tratando de manipular ese texto sino las direcciones de correo electrónico. Mientras ese AE esté ahí, aunque cause que mi sustitución sed falle después de una línea, elimine el carácter y procese bien el archivo completo.
¿Alguna idea?
+1 para el 'l0'. También hay otro script 'sedsed.py', disponible [aquí] (http://aurelio.net/sedsed/). Útil para inspeccionar los espacios 'pattern' y' hold'. No podría ayudar en este caso, pero una herramienta de depuración útil, no obstante. :) –
ese comando sed -n 'l0' es interesante, lo que imprime para la empresa es: Drob \ 357 \ 277 \ 275Sphere Inc – xref
y todavía no puedo obtener los ejemplos anteriores para trabajar con él, tal vez el personaje (que se muestra como un AE en Windows LibreOffice pero en ningún otro lugar) es en realidad un personaje especial que dice que no se puede representar en unicode? http://www.fileformat.info/info/unicode/char/fffd/index.htm – xref