Tal vez se puede usar algo como:
yourTxt = yourTxt.replaceAll("&", "&");
en algún proyecto que hice algo como:
public String replaceAcutesHTML(String str) {
str = str.replaceAll("á","á");
str = str.replaceAll("é","é");
str = str.replaceAll("í","í");
str = str.replaceAll("ó","ó");
str = str.replaceAll("ú","ú");
str = str.replaceAll("Á","Á");
str = str.replaceAll("É","É");
str = str.replaceAll("Í","Í");
str = str.replaceAll("Ó","Ó");
str = str.replaceAll("Ú","Ú");
str = str.replaceAll("ñ","ñ");
str = str.replaceAll("Ñ","Ñ");
return str;
}
estoy interesado en por qué está usted recibiendo el código HTML codificada cuerdas ... En mi aplicación "ideal" el programador nunca debería tener que ... (simplemente codifica para html el resultado, pero lo recibe ... nunca) – helios
Es un código heredado que guarda los datos en formato raw que necesito leer y convertirlo. – Vladimir
Oh. En el caso de caracteres extraños ... parece que originalmente era un carácter UTF-8 y se decodificó (se leyó) como ISO-8859-1 (ISO occidental) ... por ejemplo. Si tiene un Ñ, tiene 2 bytes en UTF-8, por lo que si lo lee en iso-western, se lee en caracteres extraños. Si es el caso y usted conoce las codificaciones, use el código 'new String (byte [], encodingName)' y 'someString.getBytes (encodingName)' para obtener los caracteres correctos. – helios