Alternativas de MapReduce

¿Hay algún paradigma alternativo a MapReduce (Google, Hadoop)? ¿Hay alguna otra manera razonable de cómo dividir & fusionar grandes problemas?Alternativas de MapReduce

Fuente

2012-01-01 Cartesius00

MapReduce no es un algoritmo o paradigma, es tecnología. –

@ralu: hay muchas maneras de lidiar con grandes problemas.MapReduce DEFINITIVAMENTE es solo uno de ellos y DEFINITIVAMENTE es a la vez paradigma y algoritmo. También su implementación se convierte en tecnología, pero no me interesan las implementaciones sino las ideas. Gracias. – Cartesius00

¿Por qué piensas en tu problema como dividir y fusionar? Solo necesitas resolver el problema. Por ejemplo, Apache Pig trata datos con SQL como el lenguaje. Y no hay una manera de dividir y combinar, aunque puede ejecutarse en un clúster de cientos de máquinas y usa Hadoop como plataforma. –

Definitivamente. Consulte, por ejemplo, Bulk Synchronous Parallel. Mapa/Reducir es, de hecho, una forma muy restringida de reducir problemas, sin embargo, esa restricción lo hace manejable en un marco como Hadoop. La pregunta es si es menos problemático presionar su problema en una configuración de Mapa/Reducir, o si es más fácil crear un esquema de paralelización específico de dominio y tener que encargarse de todos los detalles de la implementación usted mismo. Pig, de hecho, es solo una capa de abstracción sobre Hadoop que automatiza muchas transformaciones estándar de problemas desde no-Map-Reduce-y a Map-Reduce-compatible.

Editar 1/26/13: Encontrado un nice up-to-date overview here

Fuente

2012-01-01 16:13:50 Nicolas78

[Apache Hama] (http://incubator.apache.org/hama/) implementa BSP. Hama ha sido portado a [YARN (Yet Another Resource Manager)] (http://wiki.apache.org/hama/GettingStartedYARN) que es parte de Hadoop 0.23. Consulte este [blog] (http://codingwiththomas.blogspot.com/) en Apache Hama. –

Gracias Praveen;) Visite nuestro sitio web y wiki para obtener más información acerca de hama http://incubator.apache.org/hama/ –

Phil Colella identificó siete métodos numéricos para la computación científica sobre la base de los patrones de dispersión y la recolección de datos entre nodos de procesamiento, y los llamó 'empequeñece'. Estos se han añadido a por otros, una lista está disponible en los Dwarf Mine:

Dense Álgebra Lineal
Sparse de álgebra lineal Métodos
espectrales
N-Body
Grids Estructurados
Rejillas no estructuradas
MapReduce
Combinational Logi c
Gráfico Transversal
Programación Dinámica
dar marcha atrás y
Modelos gráficos Branch-and-Bound Máquinas
de Estados Finitos

Fuente

2012-01-04 12:55:57

de Microsoft Dryad se afirma que es más general que MapReduce.

Fuente

2013-05-22 20:41:11 DarenW

Actualización (agosto de 2014): La estratosfera ahora se llama Apache Flink (incubando).

Eche un vistazo a Stratosphere. Es otro tiempo de ejecución de Big Data que ofrece más operadores (mapa, reducir, unir, unir, cruzar, iterar, ...). También permite definir gráficos de flujo de datos avanzados (con Hadoop MR, tendría que encadenar trabajos).

Stratosphere también es compatible con BSP con su abstracción de procesamiento gráfico (llamada Spargel).

Si le gusta leer artículos científicos, eche un vistazo a Nephele/PACTs: A Programming Model and Execution Framework for Web-Scale Analytical Processing, explica los antecedentes teóricos del sistema.

Otro sistema en el campo es Spark que tiene su propio modelo (RDD). Dado que BSP ha sido mencionado aquí, también eche un vistazo a GraphLab, la oferta es una alternativa a BSP.

Fuente

2014-01-02 16:50:40

Respuesta

Cuestiones relacionadas