Así que recientemente comencé a aprender Scala y he estado usando gráficos como una especie de proyecto para mejorar mi Scala, y está yendo bien. Desde entonces logré paralelizar fácilmente algunos algoritmos de gráficos (que se benefician de los datos paralelización), cortesía del sorprendente soporte de Scala 2.9 para colecciones paralelas.¿Distribuir Scala sobre un clúster?
Sin embargo, quiero llevar esto un paso más allá y hacerlo en paralelo no solo en una sola máquina sino en varias. ¿Scala ofrece alguna manera limpia de hacer esto como lo hace con colecciones paralelas, o tendré que esperar hasta llegar al capítulo de mi libro sobre Actores/aprender más sobre Akka?
Gracias! -kstruct
Revisa [Scrunch] (https://github.com/cloudera/crunch/tree/master/scrunch) también para Hadoop – dhg
También hay [Escaldado] (https://github.com/twitter/scalding) para Hadoop –
sí, he comprobado cassovary, realmente genial – adelbertc