Necesito un sistema de búsqueda de valor-clave distribuido

Necesito una forma de realizar búsquedas de valores-clave en (potencialmente) cientos de GB de datos. Idealmente, algo basado en una tabla hash distribuida, que funciona muy bien con Java. Debe ser tolerante a fallas y de código abierto.Necesito un sistema de búsqueda de valor-clave distribuido

La tienda debe ser persistente, pero lo ideal sería almacenar en caché los datos en la memoria para acelerar las cosas.

Debe ser capaz de admitir lecturas y escrituras concurrentes desde varias máquinas (sin embargo, las lecturas serán 100 veces más comunes). Básicamente, el objetivo es hacer una búsqueda inicial rápida de los metadatos del usuario para un servicio web.

¿Alguien puede recomendar algo?

Fuente

2008-10-13 sanity

¿Qué está optimizando para?Por ejemplo, rendimiento de lectura (lecturas simultáneas de múltiples máquinas), tolerancia a fallas ante el hecho de que las máquinas no estén disponibles, baja cantidad de máquinas ... ¿También necesita escrituras? – Alexander

Gracias, he editado la pregunta con esta información. – sanity

¿Cómo quieres que se distribuyan tus datos? ¿Deberían todos los datos estar disponibles para/en/desde cada nodo o no? En el primer caso, la siguiente pregunta es "¿por qué la búsqueda distribuida?". – Alexander

Es posible que desee comprobar Hazelcast. Está distribuido/particionado, súper lite, fácil y gratis.

java.util.Map map = Hazelcast.getMap ("mymap"); 
map.put ("key1", "value1");

Saludos,

-talip

Fuente

2008-10-29 17:10:45

Probablemente debería especificar si tiene que ser persistente o no, en la memoria o no, etc. Usted podría intentar: http://www.danga.com/memcached/

Fuente

2008-10-13 15:37:05 carson

Gracias, he agregado una nota que debe ser persistente, lo que creo que descarta la memcached. – sanity

memcached también fue mi primer pensamiento, pero "centésimas de GB" es un poco demasiado para RAM – Javier

-1

DNS tiene la capacidad de hacer esto, no sé qué tan grande cada uno de sus registros es (8GB de toneladas de datos pequeños?), pero puede funcionar.

Fuente

2008-10-13 15:37:27

DNS asume una estructura de datos jerárquica, me temo que no hará lo que necesito. – sanity

es una implementación del protocolo CHORD en Java. Es un protocolo de tabla hash distribuida que debe ajustarse perfectamente a sus necesidades.

Fuente

2008-10-13 15:40:02

Las tablas hash distribuidas incluyen Tapiz, Acordeón y Pastelería. Uno de estos debe adaptarse a sus necesidades.

Fuente

2008-10-13 15:51:02

OpenChord suena prometedor; pero también consideraría BDB, o cualquier otra tabla hash que no sea SQL, por lo que se puede distribuir fácilmente (si la cantidad de nodos de almacenamiento es (casi) constante, al menos), solo hash la tecla en el cliente para obtener el servidor apropiado

Fuente

2008-10-13 15:55:59 Javier

Open Source Cache Solutions in Java

Oracle Coherence (solía ser Tangosol)

JCache JSR

Fuente

2008-10-14 02:30:01 ykaganovich

Dependiendo del caso de uso, Terracotta puede ser justo lo que necesita.

Fuente

2008-10-15 01:11:52

nmdb parece que es exactamente lo que necesita. Distribuido, en memoria caché, con un almacenamiento persistente en disco. Los back-ends actuales incluyen qdbm, berkeley db y (recientemente agregado después de un correo electrónico rápido al desarrollador) tokyo cabinet. Sin embargo, el tamaño de clave/valor es limitado, pero creo que se puede eliminar si no necesita soporte de TICP.

Fuente

2008-10-23 08:32:27

Trate distribuidos estructura Mapa de Redisson, se basan en Redis servidor. Al usar la configuración del clúster Redis, puede dividir datos en 1000 servidores.

Ejemplo de uso:

Redisson redisson = Redisson.create(); 

ConcurrentMap<String, SomeObject> map = redisson.getMap("anyMap"); 
map.put("123", new SomeObject()); 
map.putIfAbsent("323", new SomeObject()); 
map.remove("123"); 

... 

redisson.shutdown();

Fuente

2014-01-12 10:32:35

Necesito un sistema de búsqueda de valor-clave distribuido

Respuesta

Cuestiones relacionadas