Tengo un código de Python que está recibiendo una cadena con unicode incorrecto. Cuando trato de ignorar los caracteres incorrectos, Python aún se ahoga (versión 2.6.1). Así es como se puede reproducir:Python no puede codificar unicode incorrecto para ascii
s = 'ad\xc2-ven\xc2-ture'
s.encode('utf8', 'ignore')
arroja
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 2: ordinal not in range(128)
¿Qué estoy haciendo mal?
¿Estás seguro de que no quieres s.decode ('utf8', 'ignorar') en su lugar? – Dan
Sí, tienes razón. Whoops :) –