2011-02-10 18 views

Respuesta

17

Es UTF-8 decodificado como Latin-1 codificado como UTF-8 decodificado como CP1252.

>>> u'’'.encode('cp1252').decode('utf8').encode('latin1').decode('utf8') 
u'\u2019' 

Seriamente ... ¿quién hace esto?

+0

Llegué a pensar que era un error * triple * -encode y suspiré :) – hobbs

+6

¿Cómo diablos te diste cuenta? –

+1

Además, tiene una comilla tipográfica derecha en lugar de lo que obviamente * debería * ser un apóstrofo. – hobbs