La documentación de Hbase dice que evite crear más de 2-3 familias de columnas porque Hbase no maneja muy bien a más de 2-3 familias de columnas. La razón de esto es la compactación y el enjuague y, por lo tanto, el IO. Sin embargo, si todas mis columnas están siempre llenas (para cada fila), entonces creo que este razonamiento no es tan importante, por lo que, teniendo en cuenta que mi acceso a las columnas es completamente aleatorio (quiero acceder a cualquier combinación de columnas), ¿puedo tener una? familia de columnas: una configuración de columna (que intenta de manera efectiva hacerla puramente en columna).Familia de columnas Hbase
Hay muchos blogs/wikis explicando esto, pero todos parecen contradecir y agregar más confusión. Simplemente no parece ser capaz de digerir el hecho de que Hbase prefiere una familia de columnas, entonces ¿de qué sirve llamar es una tienda de columnas?
¡Gracias por la explicación! – PrakashT
Entonces, en mi caso, por lo que yo entiendo, tengo dos opciones: a) Tengo todas las columnas en una familia de columnas. Esto tendrá un impacto en el rendimiento, ya que la mayoría de las veces necesito acceder solo a 1-2 columnas, pero con este diseño leeré toda la fila. Aunque estas lecturas se distribuirán en muchos servidores regionales. 2) Divido mis columnas en familias de tal manera que sean de tamaños similares. – PrakashT
Probablemente deberías dejar de preocuparte por leer toda la fila. HBase es extremadamente bueno sobre solo leer lo que realmente necesita. Si la celda que necesita leer está en la memoria, HBase no hará ningún IO de disco adicional. –