2010-11-22 12 views

Respuesta

3

No necesariamente, pero en algún momento lo hará. Esto es parte de la arquitectura básica de HBase. Si imagina una tabla HBase como una hoja de cálculo, con sus filas y columnas, una región abarca múltiples filas sucesivas en una dirección y todas las columnas de una o más familias de columnas. De esta manera, toda la hoja está cubierta con mosaicos de región.

Cada región se almacena en uno o más nodos de clúster (normalmente tres). (Si pierde todos los nodos que contienen una región específica a la vez, perderá todos los datos de la región. Si solo pierde una, HBase se asegura de que se replique a otro nodo de las copias restantes.)

Ahora, cuando los datos contenidos en una región crecen demasiado, HBase inicia automáticamente una división de región, lo que da como resultado dos regiones nuevas, cada una de las cuales contiene la mitad de los datos. Solo a través de las divisiones regionales (además de la replicación de la región), los datos se distribuyen a través de un clúster HBase con el tiempo.

Almacenar datos para una fila en diferentes columnas de la misma familia de columnas asegura que los datos se almacenen juntos en un solo lugar.

0

Si los datos en la tabla son lo suficientemente grandes, HBase dividirá la tabla en diferentes regiones. Debido a que HBase es un DB orientado a columnas, las diferentes familias de columnas almacenarán en diferentes regiones.

Cuestiones relacionadas