2011-11-04 20 views
10

He estado escuchando mucho sobre Apache Hadoop como una forma increíble de realizar tareas de procesamiento intensivo. Buscando una introducción realmente básica a Hadoop. Como el equivalente helloworld, y luego tal vez un caso de uso de ejemplo.Ejemplo e introducción de Hadoop Hello World

Respuesta

10

WordCount código de ejemplo es tan simple que cualquiera puede entender nueva it.It hay

https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html#Example:+WordCount+v2.0

sólo compila con la adición de toda la haddop Api ejemplo: hadoop-core.jar Crear una. archivo jar por netbin y sorprenderse cuando se ejecuta con hadoop en cmd.

Si desea otro, he hecho un indexador sudo ... como

Cow 2.txt 3.txt 4.txt 
Cat 1.txt 

etc. 

sólo me preguntan, yo le dará el código que es tan simple.But le recomiendo que debe ejecutar este ejemplo primero.

Ahora pensé que haya completado la tarea anterior, por lo que aquí está el enlace para usar >> http://matrixsust.blogspot.com/2011/11/hadoop-simple-indexer-in-map-reduce.html

espero que ayude.

+1

Ese enlace tiene 404'd, y como parece ser uno de los mejores resultados, creo que sería bueno poner un enlace actualizado. – Acapulco

+1

He actualizado el enlace y más usted para recordatorio;) –

3

Antes de saltar a Hadoop, se requiere conocimiento de MapReduce (Hadoop se basa en MapReduce). Aquí hay algunos buenos videos en MapReduce. También verifique el Paper de Google en MapReduce.

Además, si está realmente interesado en Hadoop, el Hadoop : The Definitive Guide es imprescindible tener un libro.