Estoy casi aterrizado en Cassandra después de mi investigación sobre soluciones de almacenamiento de datos a gran escala. Pero generalmente se dice que Hbase es la mejor solución para el procesamiento y análisis de datos a gran escala.Procesamiento de datos a gran escala Hbase vs Cassandra
Si bien ambos son el mismo almacenamiento de clave/valor y ambos son/pueden ejecutarse (Cassandra recientemente) la capa Hadoop es lo que hace que Hadoop sea un mejor candidato cuando se requiere procesamiento/análisis en datos grandes.
También encontré buenos detalles acerca tanto a http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/
pero todavía estoy en busca de ventajas concretas de hbase.
Mientras estoy más convencido de Cassandra porque es simple para agregar nodos y replicación perfecta y no tiene características de punto de falla. Y también mantiene la función de índice secundario, por lo que es una buena ventaja.
Estoy bastante seguro de fragmentos de Facebook en clústeres HBAse de 100 nodos por otras razones relacionadas con su pila de software modular. En una charla reciente Todd Lipcon de Cloudera mencionó [1PT 1000 agrupaciones de HBase de nodo] (http://www.slideshare.net/cloudera/sf-nosql2011/58) y he visto mencionar más de 700 agrupaciones de HBase de nodo. – cftarnas
Buen punto. También puede ser algo específico de la carga de trabajo. – jbellis
Cuántas ventajas de Casandra anteriores. Pero ¿por qué Facebook eligió HBase en lugar de Cassandra con el tiempo? –