2011-06-15 14 views
11

Estamos trabajando con una base de datos de Cassandra que almacenará datos en el rango de petabytes. Estamos pensando en utilizar ElasticSearch o Solandra, pero nos lo pasamos muy bien decidiendo qué usar. Me pregunto si nuestra base de datos puede ser demasiado grande. Sé que ElasticSearch es escalable, pero en qué medida, especialmente con una base de datos de Cassandra.Solandra vs. ElasticSearch

Solandra, por otro lado está hecho para Cassandra y es altamente escalable, pero de nuevo, ¿en qué medida?

Ambos son escalables, pero ¿cómo escalable con Cassandra?

+1

Tenga una mirada en esta presentación que kimchy (el desarrollador principal Elasticsearch) realizado en Berlín Palabras de moda 2011: http://berlinbuzzwords.de/sites/ berlinbuzzwords.de/files/elasticsearch-bbuzz2011.pdf – DrTech

Respuesta

4

Solandra se está utilizando en la gama 10s de Terabytes.

¿Estás diciendo que quieres indexar un PB de datos en solandra o un subconjunto? Creo que si quieres 1 gran índice con un PB de datos, estás excediendo los límites. pero si quiere un PB de índices, entonces se escalará lo mismo que Cassandra.

¿Cuántos nodos está planeando ejecutar? ¿cuánto disco por nodo?

+0

Esto prácticamente responde mi pregunta. "10s of Terabyte range" es realmente lo que estaba preguntando. TAMBIÉN: – Henry

+0

¿Almacena Solandra los documentos tal como están (en filas de una familia de columnas, por ejemplo), con el índice Lucene que solo contiene información de puntero ... o están enlazados a (almacenados con) el índice mismo (que, por supuesto, se almacena en Cassandra). Si termina siendo una pregunta tonta/incierta, mis disculpas de antemano. – Henry

Cuestiones relacionadas