2010-12-09 13 views
48

tengo que analizar un documento XML que tiene este aspecto:Cómo ignorar espacio de nombres al seleccionar nodos XML con XPath

<?xml version="1.0" encoding="UTF-8" ?> 
<m:OASISReport xmlns:m="http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd" 
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
       xsi:schemaLocation="http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd"> 
    <m:MessagePayload> 
    <m:RTO> 
    <m:name>CAISO</m:name> 
    <m:REPORT_ITEM> 
    <m:REPORT_HEADER> 
     <m:SYSTEM>OASIS</m:SYSTEM> 
     <m:TZ>PPT</m:TZ> 
     <m:REPORT>AS_RESULTS</m:REPORT> 
     <m:MKT_TYPE>HASP</m:MKT_TYPE> 
     <m:UOM>MW</m:UOM> 
     <m:INTERVAL>ENDING</m:INTERVAL> 
     <m:SEC_PER_INTERVAL>3600</m:SEC_PER_INTERVAL> 
    </m:REPORT_HEADER> 
    <m:REPORT_DATA> 
     <m:DATA_ITEM>NS_PROC_MW</m:DATA_ITEM> 
     <m:RESOURCE_NAME>AS_SP26_EXP</m:RESOURCE_NAME> 
     <m:OPR_DATE>2010-11-17</m:OPR_DATE> 
     <m:INTERVAL_NUM>1</m:INTERVAL_NUM> 
     <m:VALUE>0</m:VALUE> 
    </m:REPORT_DATA> 

El problema es que el espacio de nombres "http://oasissta.caiso.com/mrtu -oasis/xsd/OASISReport.xsd "a veces puede ser diferente. Quiero ignorarlo por completo y solo obtener mis datos de la etiqueta MessagePayload en sentido descendente.

El código que estoy utilizando hasta ahora es:

String[] namespaces = new String[1]; 
    String[] namespaceAliases = new String[1]; 

    namespaceAliases[0] = "ns0"; 
    namespaces[0] = "http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd"; 

    File inputFile = new File(inputFileName); 

    Map namespaceURIs = new HashMap(); 

    // This query will return all of the ASR records. 
    String xPathExpression = "/ns0:OASISReport 
          /ns0:MessagePayload 
           /ns0:RTO 
           /ns0:REPORT_ITEM 
           /ns0:REPORT_DATA"; 
    xPathExpression += "|/ns0:OASISReport 
         /ns0:MessagePayload 
         /ns0:RTO 
          /ns0:REPORT_ITEM 
          /ns0:REPORT_HEADER"; 

    // Load up the raw XML file. The parameters ignore whitespace and other 
    // nonsense, 
    // reduces DOM tree size. 
    SAXReader reader = new SAXReader(); 
    reader.setStripWhitespaceText(true); 
    reader.setMergeAdjacentText(true); 
    Document inputDocument = reader.read(inputFile); 

    // Relate the aliases with the namespaces 
    if (namespaceAliases != null && namespaces != null) 
    { 
    for (int i = 0; i < namespaceAliases.length; i++) 
    { 
    namespaceURIs.put(namespaceAliases[i], namespaces[i]); 
    } 
    } 

    // Cache the expression using the supplied namespaces. 
    XPath xPath = DocumentHelper.createXPath(xPathExpression); 
    xPath.setNamespaceURIs(namespaceURIs); 

    List asResultsNodes = xPath.selectNodes(inputDocument.getRootElement()); 

Funciona bien si el espacio de nombres nunca cambia, pero eso no es obviamente el caso. ¿Qué debo hacer para que ignore el espacio de nombres? O si conozco el conjunto de todos los valores de espacio de nombres posibles, ¿cómo puedo pasarlos a todos a la instancia de XPath?

+2

@ user452103: XPath es XML Nombres quejan, por lo que nunca va a hacer caso omiso de espacio de nombres. Puede usar ** expression ** que selecciona nodos con respecto al espacio de nombres. Si el URI del espacio de nombres cambia tan a menudo, entonces es el URI incorrecto. ** El URI del espacio de nombres supone indicar que el elemento pertenece al vocabulario XML específico **. –

+0

@ user452103: Mantenga este formato, es más claro. –

+1

@Alejandro: gracias por el formateo, se ve mejor ahora. ¿Qué expresión puedo usar para seleccionar nodos independientemente del espacio de nombres? – lukegf

Respuesta

35

Uso:

/*/*/*/*/* 
     [local-name()='REPORT_DATA' 
     or 
     local-name()='REPORT_HEADER' 
     ] 
+0

¿Quiere usar eso como el valor de xPathExpression en el código anterior? – lukegf

+0

@ user452103: Sí, exactamente. Esta es la expresión XPath para usar. –

+0

entonces, solo para aclarar, debería ser así ahora: String xPathExpression = "/ */*/*/*/* [local-name() = 'REPORT_DATA' o local-name() = 'REPORT_HEADER']" ; – lukegf

104

Esta es FAQ (pero soy perezoso para buscar duplicados hoy)

En XPath 1,0

//*[local-name()='name'] 

Selecciona cualquier elemento con "nombre" como local nombre.

En XPath 2.0 se puede utilizar:

//*:name 
Cuestiones relacionadas