Si está trabajando en un gran conjunto de datos y están de acuerdo con una aproximación bastante buena, recomiendo encarecidamente utilizar el comando:
nodetool --host <hostname> cfstats
Esto le devolverá una lista para cada familia de columnas con este aspecto:
Column Family: widgets
SSTable count: 11
Space used (live): 4295810363
Space used (total): 4295810363
Number of Keys (estimate): 9709824
Memtable Columns Count: 99008
Memtable Data Size: 150297312
Memtable Switch Count: 434
Read Count: 9716802
Read Latency: 0.036 ms.
Write Count: 9716806
Write Latency: 0.024 ms.
Pending Tasks: 0
Bloom Filter False Postives: 10428
Bloom Filter False Ratio: 1.00000
Bloom Filter Space Used: 18216448
Compacted row minimum size: 771
Compacted row maximum size:
Compacted row mean size: 1634
El "Número de teclas (estimación)" fila es una buena conjetura en el clúster y el rendimiento es mucho más rápido que explícita contar enfoques.
Eso claramente no escala, ya que en algún punto el hash ya no cabe (útilmente) en el RAM de PHP. Cassandra es para cosas escalables. – MarkR
Lo sé, eso es lo que me preocupa. Todavía estoy en la etapa de desarrollo y estoy buscando una mejor solución para problemas como este. –