Estoy escribiendo una aplicación en Java usando import org.jdom. *;Cómo obtener los contenidos del nodo de JDOM
Mi XML es válido, pero a veces contiene etiquetas HTML. Por ejemplo, algo como esto:
<program-title>Anatomy & Physiology</program-title>
<overview>
<content>
For more info click <a href="page.html">here</a>
<p>Learn more about the human body. Choose from a variety of Physiology (A&P) designed for complementary therapies.&#160; Online studies options are available.</p>
</content>
</overview>
<key-information>
<category>Health & Human Services</category>
Así que mi problema es con el < p> etiquetas dentro del nodo overview.content.
Tenía la esperanza de que este código funcionaría:
Element overview = sds.getChild("overview");
Element content = overview.getChild("content");
System.out.println(content.getText());
pero vuelve en blanco.
¿Cómo devuelvo todo el texto (etiquetas anidadas y todo) del nodo overview.content?
Gracias
Hola, ¿cómo puedo aplanar el nodo de contenido de forma recurrente, cuando el texto se mezcla con otros nodos. Por ejemplo, un hipervínculo se encuentra en el medio de una oración. He agregado una recompensa por algo de ayuda. –
Necesita obtener todo el código HTML dentro de la etiqueta de contenido, incluidos los enlaces y las listas ordenadas. Gracias –