He intentado comprender los conceptos básicos de MapReduce en MongoDB e incluso después de implementarlo, no estoy seguro de qué tan diferente es el GROUP BY de SQL o incluso GROUP BY de Mongo. En el servidor SQL, un GROUP BY se puede hacer por stream o hash aggregate. ¿MapReduce no es similar al agregado de hash, algo más que una gran cantidad de servidores?
MapReduce y SQL GROUP POR
He estado leyendo en lugares que MR para MongoDB se va a ejecutar como proceso en segundo plano ya que es una "operación pesada". Dado que los datos están fragmentados, ¿un GRUPO BY no sería igualmente "pesado"? Dicho esto, solo estoy tratando de comparar ese tipo de operaciones que se pueden implementar tanto como un trabajo MR o mediante la consulta GROUP BY.
¿Hay algo que GROUP BY no puede hacer y solo MR puede hacer?
Además, Hadoop parece ser muy bueno en MR (Esto es solo lo que he leído ... Nunca he trabajado en Hadoop). ¿En qué se diferencia el MR de Hadoop del de Mongo?
Estoy confundido. Amablemente ayúdeme o guíeme a un buen tutorial que explique la necesidad de MapReduce.
Gracias por la información ... Estoy en lo cierto al pensar que MapReduce es básicamente una 'filosofía' de agregación y que también podría seguirse en el servidor SQL, si pudiéramos generar nuevas tablas sobre la marcha y almacenar resultados intermedios de MR en ¿ellos? –
¡No olvide marcar como respuesta si contestó su pregunta o al menos votó! :) – Ms01
nice chart :) Upvoted .... –