Estoy leyendo un archivo a través de un FileReader - el archivo está decodificado UTF-8 (con BOM) ahora mi problema es: leí el archivo y saqué una cadena, pero lamentablemente el marcador BOM se saca también ¿Por qué ocurre esto?Lectura UTF-8 - marcador BOM
fr = new FileReader(file);
br = new BufferedReader(fr);
String tmp = null;
while ((tmp = br.readLine()) != null) {
String text;
text = new String(tmp.getBytes(), "UTF-8");
content += text + System.getProperty("line.separator");
}
de salida después de la primera línea de
?<style>
no se supone UTF-8 para tener una lista de materiales! No es necesario ** ni recomendado ** por The Unicode Standard. – tchrist
@tchrist: en Microsoft, no les importan los estándares. –
Para ampliar el punto de Matti, todos los editores de texto MS prefijos de documentos UTF-8 con una lista de materiales. – Ant