Estoy tratando de analizar el archivo html normal usando el analizador SAX.Analizando html con el analizador SAX
SAXBuilder builder2 = new SAXBuilder();
try {
Document sdoc = (Document)builder2.build(readFile);
NodeList nl=sdoc.getElementsByTagName("body");
System.out.println("nodelist>>>>>>>>>>>"+nl.getLength());
} catch (JDOMException e1) {
e1.printStackTrace();
}
pero yo estoy haciendo la excepción
Open quote is expected for attribute "{1}" associated with an element type "class".
puede alguien decirme por qué estoy recibiendo esta excepción, el documento HTML está bien formado y tiene todas las etiquetas de apertura y cierre correctamente.
Gracias de antemano.
¿Hay alguna razón específica por la que desee hacer esto con SAX? – flash
No, solo quiero buscar el contenido del cuerpo del archivo html, así que lo usé. hay alguna otra solucion? – user972590
Con SAX puedes analizar XHTML, pero no estoy seguro si también puede analizar HTML (al menos la mayoría de los analizadores XML no). HTML no tiene que ser un XML bien formado. –