Después de leer http://gbif.blogspot.com/2011/01/setting-up-hadoop-cluster-part-1-manual.html llegamos a la conclusión de que nuestro clúster hadoop de 6 nodos podría usar algún ajuste, y io.sort.factor parece ser un buen candidato, ya que controla una importante compensación. Estamos planeando ajustes y pruebas, pero planificar con anticipación y saber qué esperar y qué mirar parece razonable.¿Cómo puedo saber si mi parámetro de configuración hadoop io.sort.factor es demasiado pequeño o demasiado grande?
Actualmente se encuentra en 10. ¿Cómo sabríamos que nos está causando demasiadas fusiones? Cuando lo planteemos, ¿cómo sabríamos que está causando que se abran demasiados archivos?
Tenga en cuenta que no podemos seguir los extractos de registro del blog directamente como se pone al día a CDH3b2, y estamos trabajando en CDH3u2, y han cambiado ...