Estoy construyendo un trabajo de reducción de mapas de Hadoop (0.20.1) que usa HBase (0.20.1) como fuente de datos y receptor de datos. Me gustaría escribir el trabajo en Python que me ha requerido utilizar hadoop-0.20.1-streaming.jar para transmitir datos hacia y desde mis scripts de Python. Esto funciona bien si la fuente/sumidero de datos son archivos HDFS.Hadoop mapreduce la transmisión desde HBase
¿Hadoop admite la transmisión de/a HBase para mapreduce?
Did usted tomó un vistazo a hbase + Kafka + Spark Streaming integración? – Mike