Es mejor usar analizador de HTML .... Yo prefiero usar JSoup analizador (paquete de código abierto) ....
import org.jsoup.Jsoup;
public class HTMLUtils {
public static String extractText(Reader reader) throws IOException {
StringBuilder sb = new StringBuilder();
BufferedReader br = new BufferedReader(reader);
String line;
while ((line = br.readLine()) != null) {
sb.append(line);
}
String textOnly = Jsoup.parse(sb.toString()).text();
return textOnly;
}
public final static void main(String[] args) throws Exception {
FileReader reader = new FileReader("C:/RealHowTo/topics/java-language.html");
System.out.println(HTMLUtils.extractText(reader));
}
}
puede utilizar el analizador xml –
¿Desea leerlo desde un archivo html en la web, que debe utilizar el siguiente tutorial http://docs.oracle.com/javase/tutorial/networking/urls/readingWriting .html –
De lo contrario, use de hecho un XmlParser. Por cierto, usted no finalizó la etiqueta –