Estoy buscando formas de enviar trabajos para varias computadoras en mi cuadrícula de la computadora de la Universidad.¿Debo preferir hadoop vs cóndor cuando trabajo con R?
Actualmente se está ejecutando Condor y también ofrece Hadoop.
Mi pregunta es, por tanto, debería tratar de interfaz con R para Hadoop o al Conder para mis proyectos?
Para el debate, vamos a suponer que estamos hablando de tareas Embarazosamente paralelas.
p.s: He visto los recursos descritos en el CRAN task views.
dudo que Hadoop se está ejecutando en la parte superior con Condor, Hadoop tiene su propio sistema de archivos (HDFS) y Mapa/Reducir marco. – khmarbaise
Gracias khmarbaise - No conozco el sistema subyacente, su comentario es útil. –
Hadoop se ejecuta encima de Condor. Puede utilizar Condor para unir los trabajadores de Hadoop con las máquinas que luego inician y procesan las cargas de trabajo de Hadoop. El sistema de programación de Condor es mucho más poderoso que cualquier cosa que Hadoop ofrezca de forma nativa. Ver: http://hadoopblog.blogspot.com/2009/07/hadoop-and-condor.html –