Tengo 400 millones de líneas de información única de valor-clave que me gustaría estar disponible para búsquedas rápidas en un script. Me pregunto cuál sería una forma hábil de hacer esto. Consideré lo siguiente, pero no estoy seguro de si hay alguna forma de mapear en disco el diccionario y sin utilizar mucha memoria, excepto durante la creación del diccionario.* large * python dictionary with persistence storage for quick-ups-ups
- escabeche objeto de diccionario: No estoy seguro si esto es una solución óptima para mi problema
- NoSQL tipo dBases: idealmente quieren algo que tiene la dependencia mínima en materia de la fiesta tercero más el valor clave son simplemente números. Si crees que esta sigue siendo la mejor opción, me gustaría escuchar eso también. Puede ser que me convencerá.
Háganme saber si algo no está claro.
Gracias! -Abhi
Gran diccionario con persistencia = base de datos. –
He oído que couch-db es muy útil para este tipo de cosas (pero nunca tuve que usarlo ...) –