Tengo un problema con las cadenas que obtengo de uno de mis clientes a través de xmlrpc. Me envía cadenas utf8 que están codificadas dos veces :(así que cuando las obtengo en python tengo un objeto Unicode que tiene que decodificarse una vez más, pero obviamente Python no lo permite. He notado que mi cliente sin embargo necesito hacer solución rápida por ahora antes de que lo fijaDescodificación de doble codificación de utf8 en Python
cadena cruda de volcado TCP:.
<string>Rafa\xc3\x85\xc2\x82</string>
esto se convierte en:
u'Rafa\xc5\x82'
La mejor lo que tenemos es:
eval(repr(u'Rafa\xc5\x82')[1:]).decode("utf8")
Esto se traduce en cadena correcta, que es:
u'Rafa\u0142'
esto funciona sin embargo es feo como el infierno y no se puede utilizar en el código de producción. Si alguien sabe cómo solucionar este problema de una manera más adecuada, por favor escriba. Gracias, Chris
@partisann: ¡Claro! No sabía acerca de raw_unicode_escape (obviamente 8-) – RichieHindle
Gracias partidista, tampoco lo sé. –
¡Que su reputación crezca más allá de lo esperado, incluso después de todos esos años! :) – Marian