Estoy usando un analizador HTML llamado Jsoup, para cargar y analizar archivos HTML. El problema es que la página web que estoy raspando está codificada en el juego de caracteres ISO-8859-1
, mientras que Android está usando la codificación UTF-8
(?). Esto da como resultado que algunos personajes aparezcan como signos de interrogación.¿Cómo convierto una cadena a UTF-8 en Android?
Así que ahora creo que debería convertir la cadena al formato UTF-8.
Ahora he encontrado esta clase llamada CharsetEncoder en el SDK de Android, lo que supongo que podría ayudarme. Pero no puedo encontrar la manera de implementarlo en la práctica, así que me pregunto si podría obtener ayuda con un ejemplo práctico.
ACTUALIZACIÓN: El código para leer los datos (Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);
Podría publicar el código utilizado para leer un documento html? – yanchenko
OK, he actualizado mi publicación. – droidgren