En Hadoop puede usar el mecanismo de clasificación secundaria para ordenar los valores antes de enviarlos al reductor.¿Qué clase de tecla es adecuada para el tipo secundario?
La forma en que esto se hace en Hadoop es que agrega el valor para ordenar por la clave y luego tiene algunos métodos personalizados de comparación de grupos y claves que se enganchan en el sistema de clasificación.
Por lo tanto, deberá tener una clave que consista básicamente en la clave real y el valor para ordenar. Para hacer que esto funcione lo suficientemente rápido, necesitaré una forma de crear una clave compuesta que también sea fácil de descomponer en las partes separadas que se necesitan para los métodos de comparación de claves y grupos.
¿Cuál es la forma más inteligente de hacerlo? ¿Hay una clase Hadoop "lista para usarse" que me pueda ayudar en esto o tengo que crear una clase de clave separada para cada paso de reducción de mapa?
¿Cómo hago esto si la clave en realidad es un compuesto que consta de varias partes (también se necesita por separado debido a la particionador)?
¿Qué chicos me recomiendan?
P.S. Quería agregar la etiqueta "secundaria-clasificación" pero todavía no tengo suficiente representante para hacerlo.
ahi tienes (agregue la etiqueta) :-) –
Gracias por agregar la etiqueta :) –
No entendí bien tu pregunta, ¿te importaría agregar un pequeño ejemplo? – Sudarshan