Como Soy un desarrollador de Scoob yo, no espero una respuesta imparcial.
En primer lugar, FlumeJava es un proyecto interno de Google que proporciona una abstracción (asombrosamente productiva) en la parte superior de MapReduce (aunque no en hadoop). Lanzaron un artículo al respecto, que es en lo que se basan proyectos como Scoobi y Crunch.
Si su único criterio es el vencimiento, supongo que la mejor opción es la conexión en cascada.
Sin embargo, si estás buscando la abstracción de estilo FlumeJava (imho superior), deberás elegir entre (S) crunch y Scoobi.
La mayor diferencia, aunque superficial, es que el crujido está escrito en Java, con enlaces Scala (Scrunch). Y Scoobi está escrito en Scala con enlaces de Java (scoobij). Ambas opciones son realmente sólidas, y no te equivocarás, sea cual sea tu elección. Estoy seguro de que hay una historia bastante similar con Crunch, pero Scoobi se está utilizando en proyectos reales y está en continuo desarrollo. Somos bastante activos en la corrección de errores y la implementación de características.
De todos modos, ambos son grandes proyectos con grandes personas detrás de ellos y ambos fueron lanzados en cuestión de días el uno del otro. Proporcionan la misma abstracción (con api similar), por lo que cambiar entre los dos no será un problema en lo más mínimo. Mi recomendación es darles una oportunidad y ver qué funciona para ti. Hay una cerradura en cualquiera de proyecto, por lo que no es necesario para cometer :)
Y si tiene algún comentario, ya sea para el proyecto, por favor asegúrese de proporcionar él :)