Tengo alrededor de 750,000,000 de archivos que necesito almacenar en el disco. Además, necesito poder acceder a estos archivos aleatoriamente (cualquier archivo dado en cualquier momento) en el , el menor tiempo posible. ¿Qué debo hacer para que el acceso a estos archivos sea más rápido?Acceso/almacenamiento de archivos más rápido?
Piense en ello como una tabla hash, solo las claves hash son los nombres de los archivos y los valores asociados son los datos de los archivos.
Un compañero de trabajo dice que los organice en directorios como este: si quiero almacenar un archivo llamado "foobar.txt" y está almacenado en el disco D :, coloque el archivo en "D: \ f \ o \ o \ b \ a \ r. \ t \ x \ t ". No pudo explicar por qué fue una buena idea. ¿Hay algo en esta idea?
¿Alguna idea?
El meollo de esto es la búsqueda de un archivo. ¿Cuál es la forma más rápida de encontrar un archivo por el nombre para abrir?
EDIT:
Edit2:
Quiero upvote varias respuestas exhaustivas, ya sea que estén en el clavo o no, y no puede debido a mi condición de novato. ¡Lo siento chicos!
¿Es esta información estática (750mil es), o lo está agregando (Agregando más archivos de forma periódica)? ¿Se puede leer solo o también necesita actualizar archivos? ¿Es realmente un acceso aleatorio a los archivos, o hay algún tipo de patrón de acceso que pueda observar en una inspección más cercana? – Scanningcrew
Pregunta actualizada para responder esto. (Se agregan más archivos de forma periódica, los archivos se eliminan con poca frecuencia. El acceso es aleatorio, pero se accederá a algunos archivos mucho más que otros.) – JamesBrownIsDead
Con su comentario EDIT2, solo necesita 15 representantes para votar. Ver http://stackoverflow.com/faq para más detalles. –