2012-06-19 8 views
13

Algunos datos Unicode se almacenan en el archivo como '\ u84b8 \ u6c7d \ u5730' sin ninguna codificación.Cadena de Python Unicode almacenada como ' u84b8 u6c7d u5730' en el archivo, ¿cómo convertirla de nuevo a Unicode?

¿Hay alguna manera de ocultarlos en Python?

+3

¿Quieres decir ' '\\ u84b8 \\ \\ u6c7d u5730'' o como' T' \ u84b8 \ u6c7d \ u5730''? –

+0

@Chris: no es necesario escapar de las barras diagonales inversas, ya que '\ u' no es un escape válido en cadenas de bytes. –

+0

@ IgnacioVazquez-Abrams: Lo sé; Lo puse con las barras invertidas dobladas para que mi significado sea más obvio –

Respuesta

43
>>> print '\u84b8\u6c7d\u5730'.decode('unicode-escape') 
蒸汽地 
+2

Creo que esto es probablemente lo que quiere decir, pero no estoy seguro ... si es así, es un duplicado, de todos modos. –

+0

Eso está bien. Aquí hay otra forma alternativa: 's = unicode ('\ u84b8 \ u6c7d \ u5730'," unicode-escape ")'. – Keith

+0

Pasé mucho tiempo tratando de resolver este problema, ¡ahora vi tu solución! – SKandeel

Cuestiones relacionadas