tengo un fragmento de código que estoy tratando de analizar con nokogiri que tiene este aspecto:Nokogiri a Split contenido en las etiquetas BR
<td class="j">
<a title="title text1" href="http://link1.com">Link 1</a> (info1), Blah 1,<br>
<a title="title text2" href="http://link2.com">Link 2</a> (info1), Blah 1,<br>
<a title="title text2" href="http://link3.com">Link 3</a> (info2), Blah 1 Foo 2,<br>
</td>
tengo acceso a la fuente de la td.j usando algo como esto : data_items = doc.css("td.j")
Mi objetivo es dividir cada una de esas líneas en una matriz de valores hash. El único punto de división lógico que puedo ver es dividir en los BR y luego usar algunos regex en la cadena.
Me preguntaba si hay una mejor manera de hacer esto tal vez solo con nokogiri? Incluso si pudiera usar nokogiri para absorber los 3 elementos de la línea, me facilitaría las cosas, ya que podría hacer algunos análisis regex en el resultado .content.
No estoy seguro de cómo usar Nokogiri para tomar las líneas que terminan en br, ¿debería usar xpaths? cualquier dirección es apreciada! gracias
Esto funcionó para mí. ¡Muchas gracias! –