No he encontrado ninguna documentación ni tutorial para eso. ¿Existe algo así?¿Cómo uso XPath en Nokogiri?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
El código anterior conseguirme cualquier table
, en cualquier lugar, que tiene un niño tbody
con el atributo id
igual a "threadbits_forum_251". ¿Pero por qué comienza con el doble //
? ¿Por qué hay /tr
al final? Consulte "Ruby Nokogiri Parsing HTML table II" para obtener más detalles.
¿Puede alguien decirme cómo extraer href
, id
, alt
, src
, etc., utilizando Nokogiri?
td[3]/div[1]/a/text()' <--- extracts text
¿Cómo puedo extraer otras cosas?
@Rubens gracias. Y tienes razón, necesito leer el Tutorial de XPath. Pensé que era un doc nokorigi que tenía que leer ... ¿Sabrías si hay alguna herramienta que me dé un Xpath completo si hago clic y objeta en la página html? – Radek
No lo sé, pero XPath no es tan difícil; considere su sistema de archivos, y supongamos que cada carpeta es un elemento XML; entonces, cuando seleccionas tu carpeta 'system32', obtendrás la ruta' \ windows \ system32'; simplemente reemplace ese '\\' 'por'/', considere los atributos que comienzan con' @ 'y las condiciones por' [] 'y está listo para ir –
Sé que esta es una respuesta anterior pero el enlace al tutorial xpath es ahora roto. Creo que ahora debería ser http://www.w3schools.com/xsl/xpath_intro.asp – Axiombadger