2011-12-23 14 views
5

Necesito almacenar alrededor de 100 millones de registros en la base de datos. Alrededor del 60-70% de ellos se eliminarán diariamente y se inserta la misma cantidad de registros a diario. Siento que una base de datos de documentos como Hbase, Big Table encajaría en esto. Hay muchas otras tiendas de datos como Cassandra, MongoDb, etc. ¿Qué tienda de datos sería útil para este tipo de problema, ya que habrá una gran cantidad de lecturas/escrituras (orden de 10 de millones) al día.Mejor almacén de datos para grandes cantidades de datos con gran cantidad de lecturas y escrituras

+0

Quizás quiso una comparación de eficiencia. Puede ver cada uno de estos rendimientos de tiendas de datos en sus sitios web. Utilizamos Cassandra para situaciones similares, pero no he jugado con otras áreas de almacenamiento – Nishant

+0

la naturaleza de sus datos probablemente también afecta esta comparación de base de datos – Prescott

+0

muchos almacenes de datos pueden manejar 100 millones de registros y estas tasas de lectura/eliminación. ¿Cuál es el tamaño de los registros? ¿Cuáles son tus patrones de acceso a datos, etc. ratios de escritura vs. lectura, etc.? –

Respuesta

3

Sobre la base de las características que usted ha mencionado (documentos JSON, accesos por clave, 100 millones de discos, equilibrada lectura/escritura), diría que CouchDB o Membase son buenos candidatos (aquí hay una quick comparison)

Tanto HBase y Cassandra probablemente también puede funcionar, pero para HBase necesitaría instalar muchos componentes (Hadoop, ZooKeeper, etc.) que no usaría realmente, solo usaría y Cassandra es mejor cuando tiene más escrituras que lecturas (al menos las la última vez que lo usé).

Big Table, desafortunadamente es interno de google:)

Cuestiones relacionadas