Tengo un texto que contiene caracteres como "\ xaf", "\ xbe", que, como lo entiendo desde this question, son caracteres codificados en ASCII.Cómo convertir caracteres codificados xXY a UTF-8 en Python?
Quiero convertirlos en Python a sus equivalentes UTF-8. El string.encode("utf-8")
habitual arroja UnicodeDecodeError
. ¿Hay alguna forma mejor, por ejemplo, con la biblioteca estándar codecs
?
Muestra 200 characters here.
Su muestra no incluye ninguna '\ xaf' o similares. ¿Tienes alguna muestra con tales personajes? – dkarp
Sus datos de muestra * son * UTF-8 válidos. Con los caracteres de control "separador de registro" y "separador de unidad". – dan04
Según 'enca' (http://linux.die.net/man/1/enca) es UTF-8" rodeado por/entremezclado con datos que no son de texto ". –