Project Voldemort se ve bien, pero hasta ahora no lo he investigado a fondo.
En su estado actual CouchDB podría no ser lo correcto para "grandes cantidades de datos". La distribución de datos entre nodos y consultas de enrutamiento en consecuencia está en la hoja de ruta, pero no se ha implementado hasta el momento. Las configuraciones de producción más grandes conocidas de CouchDB usan "tablas" ("bases de datos" en couch-speak) de aproximadamente 200G.
HA no es compatible de forma nativa con CouchDB pero puede compilarse fácilmente: todos los nodos CouchDB están replicando los nodos de la base de datos entre sí en una configuración de múltiples maestros. Ponemos dos Varnish proxies delante de las máquinas CouchDB y las cajas de barniz se vuelven redundantes con CARP. El diseño de CouchDBs "build from the Web" hace que estas cosas sean muy fáciles.
El problema más acuciante en our setup es el hecho de que todavía hay problemas con la replicación de archivos adjuntos grandes (MB múltiples) a los documentos de CouchDB.
Le sugiero que también compruebe la ruta RDBMS tradicional. There are huge issues con talento disponible fuera del enfoque de RDBMS y hay ofertas disponibles muy capaces de Oracle & Co.
He leído que a menudo caché hecha por InterSystems es muy usada en el 'mundo' de la salud. ¿No pueden proporcionar una solución? – tuinstoel