La página que estoy viendo contiene:¿Cómo obtener la fuente html de un elemento específico con selenio?
<div id='1'> <p> text 1 <h1> text 2 </h1> text 3 <p> text 4 </p> </p> </div>
quiero conseguir todo el texto en el div, excepto para el texto que se encuentra en la <h>
. (Quiero obtener "texto 1", "texto 3" y "texto 4") Puede haber algunos elementos <h>
, o ninguno en absoluto. Y puede haber algunos elementos <p>
, incluso uno dentro del otro, o ninguno.
Pensé hacer esto obteniendo toda la fuente html del div, y usando una expresión regular para eliminar los elementos <h>
. Pero selenium.get_text no devuelve el html, solo el texto (¡todo!).
Sé que puedo usar selenium.get_html_source
y luego buscar el elemento que necesito con una expresión regular, pero que parece un desperdicio ya que el selenio sabe cómo encontrar el elemento.
¿Alguien tiene una mejor solución? Gracias :)
¡Gracias! Resolvió el problema :) – Rivka
¿por qué no aceptas la respuesta? :) – luc
lo siento, soy nuevo en este sitio ... ¿Quisiste hacer clic en el v, derecho? – Rivka