Al tratar de arreglar un archivo PML (Palm Markup Language), parece que mi archivo de prueba tiene caracteres que no son ASCII y que hace que MakeBook se queje. La solución sería eliminar todos los caracteres no ASCII en el PML.Como eliminar ascii extendido usando python?
Así que en el intento de solucionar este problema en Python, que tienen
import unicodedata, fileinput
for line in fileinput.input():
print unicodedata.normalize('NFKD', line).encode('ascii','ignore')
Sin embargo, esto resulta en un error que la línea debe ser "Unicode, no str". Aquí hay un fragmento de archivo.
\B1a\B \tintense, disordered and often destructive rage†.†.†.\t
No estoy seguro de cómo pasar correctamente la línea para que se procese en este punto.
¿Quieres filtrar cualquier carácter cuyo valor ASCII es mayor que 255? –
Estrictamente hablando, no existe el ASCII extendido. ASCII define valores de 0 a 127. Cualquier cosa más alta que eso solo puede interpretarse arbitrariamente. Tal vez deba usar el término * caracteres que no sean ASCII *. – dreamlax
Relacionados: Función de escape seguro para la salida del terminal http://stackoverflow.com/questions/437476/safe-escape-function-for-terminal-output – jfs