Estoy tratando de entender las afirmaciones de que Cassandra escala linealmente con la cantidad de nodos. En una rápida mirada alrededor de la red, no he visto mucho de un tratamiento de este tema. Seguramente hay elementos de procesamiento serial en Cassandra que deben limitar la velocidad ganada a medida que N aumenta. Cualquier pensamiento, punteros o enlaces sobre este tema sería apreciado.¿Cuándo Cassandra golpea la ley de Amdahl?
Editar para proporcionar perspectiva:
Estoy trabajando en un proyecto que tiene una solicitud actual para una infraestructura Cassandra de más de 1.000 nodos. No vine con esta especificación. Me encuentro proponiendo que N se reduzca a un rango entre 200 y 500, siendo cada nodo al menos dos veces más rápido para el cómputo en serie. Esto es fácil de lograr sin una penalización de costo por nodo al realizar cambios simples en la configuración del servidor.
"Seguramente hay elementos de procesamiento en serie": ¿por qué estás tan seguro? – fennec
http://techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html – Schildmeijer
@fennec: Porque muy pocos problemas son 100% paralelizables –