Cuando los archivos se transfieren a nodos utilizando el mecanismo de caché distribuida en una tarea de transmisión Hadoop, ¿el sistema elimina estos archivos después de completar un trabajo? Si se eliminan, lo que supongo que son, ¿hay alguna manera de hacer que la memoria caché permanezca para múltiples trabajos? ¿Funciona de la misma manera en Elastic Mapreduce de Amazon?Duración de la memoria caché distribuida en Hadoop
6
A
Respuesta
5
Estaba cavando en el código fuente, y parece que los archivos se eliminan por TrackerDistributedCacheManager
aproximadamente una vez por minuto cuando su recuento de referencia cae a cero. El TaskRunner
libera explícitamente todos sus archivos al final de una tarea. Tal vez deberías editar TaskRunner
para no hacer esto, y controlar la memoria caché a través de medios más explícitos a ti mismo?
2
I cross posted this question at the AWS forum y recibí una buena recomendación para usar hadoop fs -get
para transferir archivos de una manera que persista en todos los trabajos.
Cuestiones relacionadas
- 1. tecnología de memoria caché distribuida
- 2. Memoria compartida distribuida en .NET
- 3. Elegir una solución de memoria compartida distribuida
- 4. Sugerencias para la solución de caché distribuida .NET simple
- 5. Biblioteca de memoria compartida distribuida para C++?
- 6. Solución de caché/sesión distribuida para la aplicación web ASP.NET
- 7. ¿Cómo funciona la memoria caché?
- 8. ¿Por dónde empiezo con la informática distribuida?
- 9. Especificación de límites de memoria con hadoop
- 10. ¿Algún sistema de caché distribuida que permite etiquetar contenido?
- 11. Borrar la memoria caché de Sitecore para un elemento de la memoria caché mediante programación
- 12. Deshabilitar la memoria caché en Apache Felix
- 13. ¿Cómo uso la memoria caché en CakePHP?
- 14. web.config o app.config en la memoria caché
- 15. ASP.Net Almacenamiento en memoria caché
- 16. java caché distribuida para baja latencia, alta disponibilidad
- 17. Compartiendo memoria caché
- 18. Determine si la ubicación de la memoria está en la memoria caché de la CPU
- 19. UIwebview sin memoria caché
- 20. Control de memoria caché HTML
- 21. Uso de la caché distribuida con Pig en Elastic Map Reduce
- 22. Diseño de memoria caché LRU
- 23. Almacenamiento en memoria caché de WebConfigurationManager.AppSettings?
- 24. ¿Es posible ejecutar Hadoop en una operación Pseudo Distribuida sin HDFS?
- 25. Asp.Net Cache, modifique un objeto de la memoria caché y cambie el valor almacenado en la memoria caché
- 26. Asigne memoria estática en la memoria caché de la CPU en c/C++: ¿es posible?
- 27. Almacenamiento en memoria caché PreparedStatement en Tomcat
- 28. Cómo configurar la memoria caché: falso en la llamada jQuery.get
- 29. Comprimir objetos Python antes de guardarlos en la memoria caché
- 30. Limpiar manualmente la memoria caché de fragmentos en Rails
Eso es una gran ayuda. Creo que podría haber otras formas de cargar archivos en los nodos que exploraré. El caché distribuido era solo el método con el que estaba familiarizado. Gracias por la referencia del código, es increíblemente útil. –