Estoy buscando una API de uso general/servicio web/herramienta/etc ... que permita convertir una página HTML dada a un gráfico RDF tan específico como sea posible (lo más probable es que use una ontología de backbone y/o mapeador).Conversión de HTML a RDF
Respuesta
Utilicé XQuery para extraer los datos de un conjunto determinado de páginas web. Tuve que escribir consultas personalizadas para las páginas web. Creo que este es el enfoque más directo para un conjunto específico de archivos HTML. Sin embargo, obviamente no es bueno para el caso general. Para un conjunto diferente de páginas web, otras consultas personalizadas deben escribirse.
¿Ha demostrado GRDDL?
GRDDL es una técnica de obtención de RDF datos de documentos XML y en páginas XHTML particulares.
Utilicé JSoup para raspar datos de HTML. Utiliza el estilo jQuery de consultar HTML DOM, que ya conocía, por lo que fue una herramienta realmente simple de usar para mí. También lo financié de forma bastante robusta, pero lo necesitaba solo para obtener 3 fuentes de datos, por lo que aún no tengo una gran experiencia con esta herramienta. jsoup
- 1. GEDCOM a HTML y RDF
- 2. conversión de HTML a RTF
- 3. Conversión de HTML a XML
- 4. Conversión de Oracle Reports (.rdf) en informes BIRT
- 5. Conversión de HTML a PDF en iOS?
- 6. Conversión de PDF a HTML con Python
- 7. Conversión de la cadena Haml a html
- 8. Conversión de HTML a odt, doc, docx
- 9. Conversión de entidades HTML con nombre a entidades HTML numéricas
- 10. Notación de N3 a RDF/XML
- 11. Conversión de tabla HTML a hoja de Excel utilizando C#
- 12. URL de Ruby a la conversión de enlace html
- 13. Conversión de HTML a PDF (no PDF a HTML) usando PHP
- 14. la conversión de rebajas sencilla (cadena) a HTML con XSLT
- 15. Conversión de HTML a content_tag en Ruby on Rails
- 16. conversión de texto html a una imagen con php
- 17. Conversión de html a svg usando javascript/jquery
- 18. Representación RDF de oraciones
- 19. Escribiendo archivo RDF/XML desde rdf Triples en rdflib
- 20. Unicode a Windows-1251 Conversión con XML (HTML) -escaping
- 21. Actualizar RDF en Triplestore
- 22. Conversión de fracciones en entidades html
- 23. djangonic manera de lidiar con rdf?
- 24. microformatos, rdf o microdatos
- 25. Analizando RDF en Smalltalk
- 26. JQuery/Javascript complemento RDF
- 27. Analisis Java n-triple RDF
- 28. predicado RDF ponderado (owl: ObjectProperty)
- 29. ¿Qué usar, XMP o RDF?
- 30. Parse large RDF en Python
¿Tiene algún control sobre el contenido del documento HTML? ¿O tiene que ser un documento aleatorio? – Scott
Puede ser cualquier documento HTML. Necesito extraer la estructura del documento HTML en un gráfico RDF. Si la conversión utiliza un mapeador/ontología de la red troncal, es aún mejor. – jaxvy
Parece que XSPARQL puede lograr esto con una consulta personalizada escrita de acuerdo con una ontología ... – jaxvy