2012-01-31 17 views
7

HDFS y GridFS son dos excelentes tecnologías para el almacenamiento de archivos distribuidos, pero ¿cuáles son sus diferencias? ¿Qué tipo de problemas se ajustan mejor a cada uno?HDFS vs GridFS: ¿Cuándo usar qué?

Respuesta

0

GridFS es poco lento frente a otros fs ... al principio pensar en otras FS como cef ...

Distribuido sistema de archivos - Wikipedia, la enciclopedia libre ->http://en.wikipedia.org/wiki/Distributed_file_system

creo que es realmente HDFS fs pero GridFS es rejilla única base de datos

al consumo en el último punto de referencia, pero apenas sugerir algo Distribuido sistema de archivos

2

Use HDFS si usa Hadoop y usa GridFS si está utilizando MongoDB. Tampoco son geniales para almacenar archivos aleatorios. Están diseñados para trabajar con la plataforma analítica.

1

Recomendaría utilizar GridFS, si solo va a almacenar sus archivos sin ninguna tarea analítica y de reducción de mapas. Es más fácil de personalizar y mantener. Utilicé para la aplicación de alojamiento de archivos. HFDS en este caso es excesivo.

3

HDFS destinados al procesamiento por lotes (que estés sabes, cuando se ejecuta una consulta que va a leer muchos de sus archivos uno por uno), pero en realidad chupar cuando usted que hace de acceso aleatorio operaciones y es doloroso mantenerlo o incluso implementarlo (ya sabes, todos estos Zookepers, Namenodes, etc.). Por otro lado, GridFS es más lento en los lotes, pero no en el caso cuando haces muchos accesos aleatorios, pero tienes una sobrecarga de almacenamiento mayor en comparación con HDFS.

Yo diría que debe usar HDFS para analitycs y GridFS para respaldar el sitio web.

Cuestiones relacionadas