como clase DOMDocument en PHP, ¿hay alguna clase en RUBY (es decir, el núcleo RUBY) para analizar y obtener el valor de elementos de nodo de un documento HTML.Método para analizar el documento HTML en Ruby?
Respuesta
No hay un analizador de HTML incorporado (todavía), pero algunos muy buenos están disponibles, en particular Nokogiri.
Meta-respuesta: Para necesidades comunes como estas, recomendaría visitar el sitio Ruby Toolbox. Notarás que Nokogiri es la mejor recomendación para HTML parsers
Debe consultar hpricot. Es extremadamente bueno. No es rubí "central", pero es una gema de uso común.
También puedes probar Oga de Yorick Peterse.
Es un analizador XML/HTML escrito en Ruby que no requiere bibliotecas de sistema como libxml. Lo puedes encontrar aquí. https://github.com/YorickPeterse/oga
Ruby Cheerio - Un analizador HTML de estilo jQuery en ruby. Una versión simplificada de Nokogiri para rastreadores. Esta es la versión ruby del paquete NodeJS más popular cheerio.
Follow the link for a simple crawler example.
joya instalar rubí cheerio
require 'ruby-cheerio'
jQuery = RubyCheerio.new("<html><body><h1 class='one'>h1_1</h1><h1>h1_2</h1></body></html>")
jQuery.find('h1').each do |head_one|
p head_one.text
end
# getting attribute values like jQuery.
p jQuery.find('h1.one')[0].prop('h1','class')
# function chaining similar to jQuery.
p jQuery.find('body').find('h1').first.text
Muy buen enfoque! Buena recomendación! Gracias @dineshsprabu. –
Gracias Fernando Kosh – dineshsprabu
- 1. Eliminar texto del documento HTML con Ruby
- 2. Usando XPath para analizar un documento XML
- 3. Tagsoup no puede analizar el documento HTML de una StringReader (Java)
- 4. analizar cadena html con jquery
- 5. Cómo analizar HTML desde JavaScript en Firefox?
- 6. Reemplazar todo el documento HTML en contexto
- 7. Cómo analizar HTML mal formado en python
- 8. Método sin bloqueo para analizar XML en python
- 9. El método 'upto' en Ruby
- 10. ¿Cómo funciona el análisis de un documento HTML/XML?
- 11. PHP analizar HTML
- 12. método de java para analizar expresiones anidadas
- 13. DTD error de descarga al analizar documento XHTML en XOM
- 14. ¿Documento HTML a PDF?
- 15. Incrustar datos brutos en HTML para analizar en jQuery
- 16. Analizando documento HTML: ¿Expresión regular o LINQ?
- 17. Ruby "count" método para hash
- 18. Cómo analizar documentos de texto con ruby?
- 19. Biblioteca para analizar SVG en Ruby o Python
- 20. Recorrer un método C# y analizar el cuerpo del método
- 21. ¿Cómo puedo obtener Nokogiri para analizar y devolver un documento XML?
- 22. Método abstracto en Ruby
- 23. ¿Cómo usar expresiones regulares para analizar HTML en Java?
- 24. Python: ¿Hay un paquete integrado para analizar html en dom
- 25. Cómo analizar HTML para modificar todas las palabras
- 26. ¿Qué tipo de documento HTML?
- 27. ¿Incrustar el código de Ruby en HTML?
- 28. Documento XML de Parse en Ruby
- 29. ¿Heredar el método initialize() en ruby?
- 30. Usar expresiones regulares para analizar HTML: ¿por qué no?
hpricot lamentablemente ya no existe. Nokogiri es ahora la solución preferida. – superluminary