tengo el siguiente código HTML que está dentro de un documento más grandeBeautifulSoup para extraer el texto entre los saltos de línea (por ejemplo, <br /> etiquetas)
<br />
Important Text 1
<br />
<br />
Not Important Text
<br />
Important Text 2
<br />
Important Text 3
<br />
<br />
Non Important Text
<br />
Important Text 4
<br />
Actualmente estoy usando BeautifulSoup para obtener otros elementos dentro del HTML, pero no han podido encontrar una forma de obtener las líneas de texto importantes entre las etiquetas <br />
. Puedo aislar y navegar a cada uno de los elementos <br />
, pero no puedo encontrar la manera de obtener el texto intermedio. Cualquier ayuda sería muy apreciada. Gracias.
Ahh, el problema era que estaba usando findNextSibling(), y que fue simplemente pasando por alto el texto e ir al siguiente salto de línea. Usando nextSibling funcionó. ¡Gracias por la ayuda! – maltman
¡Gran respuesta, esto me salvó un montón de dolor de cabeza! – Nick
¿'next' no es una palabra reservada en Python? Tal vez un nombre de variable diferente sería mejor? (Este es un punto menor, pero tales cosas se suman!) – duhaime