2011-04-25 8 views
9

Una pregunta algo extraña, pero ¿alguien sabe qué tipo de tipo utiliza MapReduce en la porción de orden de orden aleatorio/ordenación? Pensaría fusión o inserción (de acuerdo con todo el paradigma de MapReduce), pero no estoy seguro.MapReduce método de orden aleatorio

Respuesta

9

Es Quicksort, luego las salidas intermedias clasificadas se fusionan. Quicksort comprueba la profundidad de recursión y se da por vencido cuando es demasiado profundo. Si este es el caso, se usa Heapsort.

Tener un vistazo a la clase ordenación rápida:

org.apache.hadoop.util.QuickSort 

Puede cambiar el algoritmo utilizado a través del valor map.sort.class en el hadoop-default.xml.

+0

Thx para la edición. –

+1

Esta técnica de cambio de clasificación es una clasificación híbrida estándar AFAIK. Se llama IntroSort: http://en.wikipedia.org/wiki/Introsort –

Cuestiones relacionadas