2012-03-15 30 views
5

Escenario 1:Recuperar Hadoop NameNode fracaso

El fsimage HDFS y editlog se escriben en varios lugares, incluyendo un montaje NFS.

A) NameNode Daemon Crash: Solución: sólo tienes que reiniciar el proceso NameNode

B anfitrión) es hacia abajo, donde el nombre de nodo se está ejecutando.

Solución:

  1. Iniciar el NameNode en un host diferente con un dfs.name.dir vacío
  2. punto del dfs.name.dir al montaje NFS donde tenemos copia de los metadatos. O
  3. opción
  4. Uso --importCheckpoint mientras que a partir NameNode después de señalar fs.checkpoint.dir en checkpoint directorio desde NameNode secundaria
  5. Cambiar el fs.default.name al nombre de host de copia de seguridad URI y reinicie el clúster con todo el esclavo IP en el archivo de esclavos.

Nota - Podemos perder la edición que pudo haber ocurrido después del último punto de control.

Escenario 2:

El fsimage HDFS está escrito en un solo directorio.

A) NameNode Daemon Crash: Solución: Desconocido

B) Host se ha reducido en el que el nombre de nodo se está ejecutando.

Solución:

  1. Crear un directorio en blanco apuntando a dfs.name.dir al directorio en el (1)
  2. inicio NameNode con -importCheckpoint después de señalar fs.checkpoint.dir en checkpoint directorio de Secundaria NameNode
  3. Cambie el fs.default.name por el nombre de usuario de la copia de seguridad URI y reinicie el clúster con todas las direcciones IP esclavas en el archivo esclavo.

De esta manera, extrañaríamos nuevamente los archivos editados después del último punto de control.

Háganme saber si es así como podemos recuperar el clúster manualmente.

+0

¿Puedes editar tu publicación para incluir una pregunta adecuada, por favor? No estoy seguro de lo que estás preguntando. También sería útil publicar algunos fragmentos de archivos de registro si los tiene. Me ayudará a diagnosticar tus problemas. Gracias –

+0

Estoy dando un escenario de producción. Qué hacer en caso de Escenario 1 y Escenario 2. Para obtener diferentes técnicas de recuperación de Namenode – Jagaran

+0

cambió la pregunta ahora – Jagaran

Respuesta

1

En producción, debe ejecutar los NameNodes en modo HA con un quorum of journalling nodes, o un HA-NFS storage compartido para los archivos de transacciones de registro de edición. Si no quiere o no usa HA, necesita ejecutar la NN con al menos dos directorios de almacenamiento para ambas imágenes y editar registros, preferiblemente uno como punto de montaje NFS montado en forma suave para la persistencia automática fuera de la máquina del sistema de nombres .

Si solo tiene un directorio de almacenamiento y no tiene configuración HA, lo mejor que puede obtener es un punto de control del período anterior, si pierde todos los archivos. En caso de que no haya perdido archivos, puede probar una opción hadoop namenode -recover como se ilustra en este post para poder recuperar la imagen más algunas (o todas) ediciones.

+0

¿Cuál es el riesgo en la realización de la opción de recuperación de hadoop namenode en un Faulure Namenode. –

+0

El riesgo es perder los cambios que le pide al modo de recuperación que se saltee. Estos pueden ser desde creaciones de archivos o directorios, hasta modificaciones de atributos como actualizaciones de tiempo de acceso. –

Cuestiones relacionadas