2010-03-31 14 views

Respuesta

43

No hay un analizador de HTML incorporado (todavía), pero algunos muy buenos están disponibles, en particular Nokogiri.

Meta-respuesta: Para necesidades comunes como estas, recomendaría visitar el sitio Ruby Toolbox. Notarás que Nokogiri es la mejor recomendación para HTML parsers

9

Debe consultar hpricot. Es extremadamente bueno. No es rubí "central", pero es una gema de uso común.

+2

hpricot lamentablemente ya no existe. Nokogiri es ahora la solución preferida. – superluminary

2

Ruby Cheerio - Un analizador HTML de estilo jQuery en ruby. Una versión simplificada de Nokogiri para rastreadores. Esta es la versión ruby ​​del paquete NodeJS más popular cheerio.

Follow the link for a simple crawler example.

joya instalar rubí cheerio

require 'ruby-cheerio' 

jQuery = RubyCheerio.new("<html><body><h1 class='one'>h1_1</h1><h1>h1_2</h1></body></html>") 

jQuery.find('h1').each do |head_one| 
    p head_one.text 
end 

# getting attribute values like jQuery. 
p jQuery.find('h1.one')[0].prop('h1','class') 

# function chaining similar to jQuery. 
p jQuery.find('body').find('h1').first.text 
+0

Muy buen enfoque! Buena recomendación! Gracias @dineshsprabu. –

+0

Gracias Fernando Kosh – dineshsprabu

Cuestiones relacionadas