Analizando archivos XML grandes usando el analizador SAX (omita algunas líneas/etiquetas)

Actualmente estoy desarrollando una aplicación que recupera datos de Internet usando SAX. Lo usé antes para analizar archivos XML simples como Google Weather API. Sin embargo, los sitios web que me interesan llevan el análisis al siguiente nivel. La página es enorme y se ve desordenada. Solo necesito recuperar algunas líneas específicas; el resto no es útil para mí.
¿Es posible omitir esas líneas/etiquetas inútiles, o tengo que ir paso a paso?Analizando archivos XML grandes usando el analizador SAX (omita algunas líneas/etiquetas)

Fuente

2010-08-05 Amine

Creo extendida ETV-xml le permite acceder a XML con acceso aleatorio de un modo eficiente de memoria, mucho mejor que SAX o digestor Apache –

Sí, puede omitir. Simplemente defina las etiquetas que desee y solo obtendrá esos valores de etiquetas.

Fuente

2010-08-05 04:42:14

Thaks un lote, su respuesta me salvará larga líneas de códigos! – Amine

Puede intentar usar XPath que usará SAX detrás de la escena para analizar su xml. La desventaja aquí es que XML se analizará en cada llamada del método de evaluación de Xpath.

Fuente

2010-08-05 04:42:59

¡Gracias por su respuesta, examinaré esta posibilidad! – Amine

Usted desea leer etiquetas específicas a continuación DOM analizador es mucho más rápido que SAX parser..SAX analizador es útil si desea analizar grandes archivos XML ..

Fuente

2010-08-05 04:49:23

El análisis SAX es mucho más rápido que DOM. DOM también requiere que todo el documento se traiga a la memoria. –

Muchas gracias por su respuesta, realmente aprecio su ayuda, intentaré usar DOM y ver qué salidas obtengo! – Amine

Sí puede hacerlo, simplemente ignorar las etiquetas usted no está interesado en. Pero en cuenta que todo el documento tendrá que ser analizado para esto (DefaultHandler impl)

public startElement(String uri, String localName, 
    String qName, Attributes attributes) { 
    if(localName.equals("myInterestingTag") { 
    // do your thing.... 
    } 
} 

public void endElement(String uri, String localName, String qName) { 
    if(localName.equals("myInterestingTag") { 
    // do your thing.... 
    } 
} 

public void characters(char[] ch, int start, int length) { 
    // if parsing myinteresting tag... do some stuff. 
}

Fuente

2010-08-05 04:58:11 naikus

Gracias, así es como lo hago habitualmente;)! – Amine

usted puede tratar de una combinación de TagSoup para crear un documento XML analizable y XPath para ir a buscar las partes interesantes .

Fuente

2010-08-05 08:06:17

gracias DaDaDom por su respuesta, lo investigaré lo antes posible! – Amine

usando tristemente xpath no es tan fácil en Android – Janusz

Véase mi respuesta a una pregunta similar para la estrategia de utilizar SAX para saltar/ignore las etiquetas:

Skipping nodes with sax

Se trata de cambiar ContentHandlers en el XMLReader. Cuando lea una portación del documento XML que desea omitir, simplemente cambie el ContentHandler que no hace nada con los eventos. Cuando se llega al final de la sección que se va a ignorar, pasa el control al manejador de contenido que estaba utilizando para procesar el contenido XML.

Fuente

2010-08-05 15:06:37

¡Su respuesta ciertamente ayudará a lograr mi objetivo!muchas gracias -Cheers – Amine

Me gusta commons-digester. Le permite especificar reglas contra etiquetas particulares. La regla se ejecuta solo cuando se encuentra la etiqueta.

Digester está construido sobre sax y por lo tanto tiene todas las características de saxo más la especificidad necesaria para analizar selectivamente etiquetas específicas. También utiliza una pila que se empuja con nuevos elementos cuando se encuentra la etiqueta correspondiente y se abre cuando el elemento finaliza.

Lo uso para analizar todos mis archivos de configuración.

Salida digestor en http://commons.apache.org/digester/

Fuente

2010-08-05 15:46:05

Muchas gracias Raja, voy a buscar en esta solución !! – Amine

Analizando archivos XML grandes usando el analizador SAX (omita algunas líneas/etiquetas)

Respuesta

Cuestiones relacionadas