2010-08-21 21 views
5

He estado utilizando OpenLink Virtuoso como una tienda RDF desde hace algún tiempo y, aunque es excelente para grandes cantidades de datos, no estoy satisfecho con el rendimiento del cruce de gráficos con SPARQL. Recientemente, he escuchado mucho sobre el rendimiento transversal de Neo4j y pensé que vale la pena intentarlo. Entonces, con el propósito de tener una gran tienda RDF con un buen rendimiento de recorrido, ¿es mejor cambiar a Neo4j?Neo4j vs OpenLink Virtuoso

No tengo idea del rendimiento de Neo4j con datos grandes y, bueno, la parte RDF/SPARQL de Neo4j no parece tan madura. Gracias por tu tiempo.

+0

favor ver este ejemplo de rastreo transitiva basado en SPARQL. El backend tiene 29 mil millones + triples. Enlace: http://lod.openlinksw.com/b3s/search.vsp?q=6 –

Respuesta

4

Virtuoso "Transitivity in SPARQL" sería el método recomendado para el recorrido de gráfico. También tenemos un tutorial on Transitivity que proporciona algunas consultas de muestra. También hay disponibles consultas de ejemplo en vivo en nuestras instancias LOD Cloud Cache (30+ billion triples) y URIBurner (500+ million triples). Nuestro blog el Virtuoso Transitivity and Graphs for SQL también haría una lectura interesante ...

(Answer Hugh Williams, OpenLink Software)

+0

Muchas gracias, voy a saltar sobre eso. Y una pregunta más viene a mi mente, ¿cómo las consultas sobre cURL reducen el rendimiento en comparación con ODBC o JDBC? – parsa

0

Puede proporcionar más información sobre el problema de rendimiento transversal del gráfico que se encuentra con Virtuoso, de modo que posiblemente podamos ofrecer asesoramiento sobre cómo mejorar esto. Por favor, también proporcione la versión de Virtuoso en uso?

Saludos

Hugh Williams

Software

Openlink

+1

Hola Hugh, Estoy usando 6.01.3127 (versión de Opensource) en un cuadro de Ubuntu. En realidad, mi observación con Virtuoso no se basa en números, solo en mi sentido personal. El gráfico se cargó con el último conjunto de datos DBPedia (3.5.1) y luego se realizaron consultas en el punto final SPARQL a través de enlaces cURL en PHP (localmente). Implementé una búsqueda simplista y clásica de amplitud con el objetivo de encontrar la longitud de la ruta más corta entre 2 nodos. ¿Qué sugieres? Gracias por tu tiempo. – parsa

+1

/@ parsa - para referencia futura, las respuestas SO no están pensadas para funcionar como un foro de discusión. –

0

me gustaría ver el código fuente y los datos y los archivos de configuración antes de proporcionar alguna pista. No es raro obtener una diferencia de rendimiento de 500x debido a trivialidades como un índice faltante o una configuración de configuración. ¿Podría proporcionar más detalles, tal vez a través del Virtuoso Users mail list?