Mi trabajo no requiere clasificación, solo información de agregación por clave. Entonces, creo que es posible desactivar la clasificación de toda la información para aumentar el rendimiento.¿Es posible desactivar la ordenación en hadoop?
Nota: No puedo establecer que los reductores cuenten a cero porque necesito agregar datos entre muchos mapeadores. Simplemente no me interesa el resultado ordenado con un reductor.
AFAIK, la clasificación es una fase esencial en el trabajo de MR, no puede omitirlo. La clasificación generalmente no es un elemento importante de la sobrecarga del rendimiento. – wlk
yura, encontraste una solución? Estoy votando para cerrar como una víctima, porque en la otra pregunta, ¡en realidad hay una respuesta! – gsamaras
Posible duplicado de [Hadoop y Python: deshabilitar ordenación] (http://stackoverflow.com/questions/19188263/hadoop-and-python-disable-sorting) – gsamaras