Estoy buscando información general sobre cómo otras personas están usando Hadoop u otras tecnologías similares a MapReduce. En general, tengo curiosidad por saber si está escribiendo aplicaciones MR para procesar conjuntos de datos existentes (como archivos de registro del servidor web), o ¿está escribiendo aplicaciones que generan y procesan nuevos conjuntos de datos?¿Cómo se usa MapReduce/Hadoop?
Editar: preguntas de seguimiento
(1) ¿Alguna vez se ejecuta un programa de MR con los datos generados por otros programas de RM?
(2) ¿Alguna vez necesita modificar los conjuntos de datos existentes utilizando MR?
(3) ¿Alguna vez ha compartido sus conjuntos de datos con otros desarrolladores?
Esta es una publicación anterior. Ya publiqué mi trabajo de investigación sobre MapReduce. Puede encontrar más información (y nuestro código fuente de referencia) aquí: [http://database.cs.brown.edu/projects/mapreduce-vs-dbms/](http://database.cs.brown. edu/projects/mapreduce-vs-dbms /) – apavlo