Según el Hadoop : The Definitive Guide.¿Cómo extraer datos en las funciones Mapa/Reducir?
La nueva API admite un estilo de iteración "push" y "pull". En ambas API, los pares de registros de valores clave se envían al asignador, pero además, la nueva API permite que un asignador extraiga registros desde el método map(). Lo mismo aplica para el reductor. Un ejemplo de cómo puede ser útil el estilo "pull" es procesar registros en lotes, en lugar de uno por uno.
¿Alguien ha extraído datos en las funciones de Mapa/Reducir? Estoy interesado en la API o el ejemplo para el mismo.
Creo que este escenario va a ser útil cuando su procesamiento de la clave/valor actual va a depender del siguiente par de valores clave. –
Podría haberse hecho con la API anterior y la nueva. Pero, el desafío es manejar la situación cuando los datos se distribuyen en bloques. –
¿Cómo puedes hacerlo con la antigua API? –