2012-01-24 26 views
5

HBase tiene un modelo maestro-esclavo, mientras que Cassandra tiene un modelo de igual a igual. Soy consciente de que en un modelo maestro-esclavo, el maestro es un SPOF (punto único de falla) y no existe tal cosa en un modelo de igual a igual.Computación distribuida de maestro a servidor vs peer-to-peer

¿Hay otros pros y contras de cada modelo? Especialmente estoy buscando cualquier ventaja del maestro-esclavo sobre el modelo de igual a igual.

+0

podría ser un poco demasiado discursiva para stackoverflow, pero desde que ha buena reputación, que podría salirse con la suya ;-) – halfer

+0

Sé que es una poco discursivo. Estoy planeando pasar algún tiempo en HBase o Cassandra, así que comencé a mirarlos a los dos. Entonces, la consulta? No pude obtener una comparación de estos dos modelos. Entonces, cualquier puntero es apreciado. –

Respuesta

0

Un punto es que el maestro no es un SPOF en HBase, ya que puede tener una configuración Multi-Master. http://wiki.apache.org/hadoop/Hbase/MultipleMasters

Tener el máster hace que sea un poco más fácil saber dónde están los datos y hacia dónde se dirigen. También está basado en Hadoop, por lo que la integración con Map Reduce es bastante agradable (donde un trabajo de Map se dividirá naturalmente en los servidores de la región y le dará una fila). Creo que esta es la principal ventaja.

El principal "con" de Cassandra es el modelo de consistencia eventual, aunque le permite elegir modelos de consistencia.

Un punto de comparación es que los datos en HBase se ordenan por clave, donde es aleatorio en Cassandra. Esto puede proporcionar algunos beneficios con las claves inteligentes en HBase, aunque siempre puede elegir un GUID o una clave aleatoria para emular el comportamiento de Cassandra. Cassandra puede particionar de forma no aleatoria, pero HBase es aún mejor para escaneos de rango.

He usado ambos, y ambos funcionan, y ambos requieren mucho trabajo para seguir trabajando.

+0

Miré tanto a Cassandra como a HBase y estoy un poco familiarizado con ambos, como se menciona en el OP, la consulta se refería a la computación distribuida maestro a esclavo frente a igual a igual. Pros y contras de estos dos modelos de computación distribuida. –

+0

Mi punto principal era corregir su afirmación de que el maestro en HBase es un SPOF, ya que son posibles múltiples maestros. Las características que mencioné en Hbase son las habilitadas por tener un control maestro de la partición de datos. – MattMcKnight

-1

estructura maestro-esclavo es más eficaz, el P2P es más estable

Cuestiones relacionadas