tengo el siguiente escenario en mi ejemplo hbaseHBase obtener todos los valores de sellos de tiempo para una célula
hbase(main):002:0> create 'test', 'cf'
0 row(s) in 1.4690 seconds
hbase(main):003:0> put 'test', 'row1', 'cf:a', 'value1'
0 row(s) in 0.1480 seconds
hbase(main):004:0> put 'test', 'row2', 'cf:b', 'value2'
0 row(s) in 0.0070 seconds
hbase(main):005:0> put 'test', 'row3', 'cf:c', 'value3'
0 row(s) in 0.0120 seconds
hbase(main):006:0> put 'test', 'row3', 'cf:c', 'value4'
0 row(s) in 0.0070 seconds
Ahora bien, si se verá, los dos últimos insertos son de la misma familia de columnas, misma columna y misma clave. Pero si entiendo hbase correctamente, cf: c + row3 representa una celda que tendrá todas las marcas de tiempo del valor insertado.
Sin embargo, un simple retorno de barrido único valor reciente
hbase(main):010:0> scan 'test'
ROW COLUMN+CELL
row1 column=cf:a, timestamp=1317945279379, value=value1
row2 column=cf:b, timestamp=1317945285731, value=value2
row3 column=cf:c, timestamp=1317945301466, value=value4
3 row(s) in 0.0250 seconds
¿Cómo consigo todos los valores de sellos de tiempo para una célula, o cómo realizar consulta basada rango de tiempo?
No es que sea el caso aquí, pero también debe asegurarse de que la tabla admita múltiples versiones, es decir, que le dé a CF el parámetro de versiones. – Tony
de hecho, tienes razón @Tony. crear una tabla con: "create 'test', {NAME => 'cf', VERSIONS => N}" (por defecto es 3) sería una buena práctica. Y las versiones se aplican a las familias de columnas, no a las tablas, debe dar una versión a cada familia de columnas en la tabla. – frail
Me pregunto si hay alguna forma de decirle a 'scan' que recupere todas las versiones existentes, en lugar de establecer un umbral –