Tengo un problema con Hadoop produciendo demasiados archivos de registro en $ HADOOP_LOG_DIR/userlogs (el sistema de archivos Ext3 solo permite 32000 subdirectorios) que se ve como el mismo problema en esta pregunta: Error in Hadoop MapReduceConfigurar el registro de Hadoop para evitar demasiados archivos de registro
Mi pregunta es: ¿Alguien sabe cómo configurar Hadoop para rodar el directorio de registro o evitarlo? Intento evitar simplemente establecer las propiedades "mapred.userlog.retain.hours" y/o "mapred.userlog.limit.kb" porque quiero conservar realmente los archivos de registro.
También esperaba configurar esto en log4j.properties, pero mirando el origen de Hadoop 0.20.2, escribe directamente en los archivos de registro en lugar de usar log4j. Quizás no entiendo cómo se usa log4j por completo.
Cualquier sugerencia o aclaraciones sería muy apreciada.
Así que he encontrado :) Nuestra solución es modificar nuestro proceso de recopilación de datos para concatenar archivos antes de ejecutar cualquier trabajo. –