¿Es mejor usar el paquete mapred o mapreduce para crear un trabajo de Hadoop?

Para crear trabajos de MapReduce puede usar el paquete org.apache.hadoop.mapred antiguo o el paquete org.apache.hadoop.mapreduce más reciente para Mappers y Reductores, Trabajos ... El primero se marcó como obsoleto, pero esto se revirtió mientras tanto. Ahora me pregunto si es mejor usar el viejo paquete mapred o el nuevo paquete mapreduce para crear un trabajo y por qué. ¿O solo depende de si necesita cosas como MultipleTextOutputFormat, que solo está disponible en el paquete mapred anterior?¿Es mejor usar el paquete mapred o mapreduce para crear un trabajo de Hadoop?

Fuente

2011-09-29 momo13

'pero esta meanwhile' consiguió revertidas ¿está seguro? –

P. ej. Interface Mapper en el paquete org.apache.hadoop.mapred.lib en r0.21.0 no está marcado como obsoleto mientras está marcado como obsoleto en r0.20.2. – momo13

Funcionalidad sabia que no hay mucha diferencia entre el antiguo (o.a.h.mapred) y el nuevo (o.a.h.mapreduce) API. La única diferencia significativa es que los registros se envían al asignador/reductor en la antigua API. Mientras que la nueva API admite ambos mecanismos de extracción/extracción. Puede obtener más información sobre el mecanismo de extracción here.

Además, la antigua API ha sido un-deprecated desde 0.21. Puede encontrar más información sobre la nueva API here.

Como mencionó algunas de las clases (como MultipleTextOutputFormat) no se han migrado a la nueva API, debido a esto y al motivo mencionado anteriormente, es mejor seguir con la API anterior (aunque una traducción suele ser bastante simple).

Fuente

2011-09-29 16:21:10

¿Hay alguna razón por la cual los javadocs no mencionan nada de esto? – cmcginty

[Hadoop - La guía definitiva] (http://shop.oreilly.com/product/0636920021773.do) tiene la mayor parte del código en la nueva API. –

Como nota al margen: MRUnit usa la nueva API, .mapreduce. Entonces, si estás usando .mapred en tu código, lanzará errores. Y no vas a ser feliz. – wmute

Tanto la API anterior como la nueva son buenas. La nueva API es más limpia. Use la nueva API siempre que pueda y use la antigua donde necesite clases específicas que no estén presentes en la nueva API (como MultipleTextOutputFormat)

Pero tenga cuidado de no usar una combinación de las API antiguas y nuevas en el mismo trabajo de Mapreduce. Eso lleva a problemas extraños.

Fuente

2011-09-29 18:28:59

API Viejo (mapred)

existe en paquete org.apache.hadoop.mapred
proporcionar un mapa/reducir la configuración de la tarea.
Reduce los valores de una clave determinada, basado en el iterador
paquete Summary

Nueva API (mapreduce)

Existe en paquete org.apache.hadoop.mapreduce
La configuración del trabajo se realiza por clase separada, llamada JobConf que es exte nsion de configuración
Clase
Reduce los valores de una clave determinada, en base a la Iterable
Package Summary

Fuente

2014-09-25 13:33:58 anish

org.apache.hadoop.mapred es la API anterior y org.apache.hadoop.mapreduce es la nueva. Es posible que desee cambiar su respuesta – Harinder

@Dennis actualizó la respuesta – anish

Además, JobConf es parte de la API mapreduce, no la API de mapreduce – ryanbwork

¿Es mejor usar el paquete mapred o mapreduce para crear un trabajo de Hadoop?

Respuesta

Cuestiones relacionadas