Estoy buscando una herramienta de flujo de trabajo para ejecutar trabajos complejos de map-reducir. Tengo a Oozie en mente pero también quiero explorar Cascading. ¿Hay algún ejemplo de código o ejemplo que encadena trabajos M/R existentes utilizando API en cascada? Además, ¿puede proporcionar la comparación Oozie Vs Cascading?Herramienta de flujo de trabajo comaparison: Oozie Vs Cascading
Respuesta
Cascading y Oozie no están en la misma categoría.
Oozie es un programador de flujo de trabajo.
Cascading es una API para crear flujos de trabajo. Es independiente de los programadores, es decir, debe ejecutarse con el sistema de programador que utilice.
Quizás haya algo de confusión porque los documentos de Oozie mencionan un "DAG", y ambos se ejecutan sobre Hadoop.
Además, Cascading tiene una noción de "disponibilidad de datos" en el soporte de punto de control, que es compatible con Oozie, aunque de forma diferente.
Personalmente jugar con tanto en cierta medida, lo que encontré interesante con cascada es
1) conciso y expresivo en términos de palabras clave simples como flujo, grifo, tubo, etc.,
2) increíble enfoque basado en TDD para el desarrollo local y la investigación
3) buena vista del planificador (archivo .dot) y será útil una vez que el proyecto crezca, por lo que el mantenimiento es fácil.
4) Enfoque basado en DSL usando groovy, scala, cloujre. así que no hay necesidad de preocuparse por aprender un nuevo idioma o más bien hadoop.
5) despliegue simple en la nube (por ejemplo, soporte de Amazon como despliegue de jar sin procesar).
6) puede llamar a cualquier cosa como cerdos o colmenas existentes o puros otros jarros de MR siempre que expongan java api.
7) increíble para trabajos relacionados con ML y PNL.
- 1. Flujo de trabajo XAML Intellisense VS 2010
- 2. Git cereza-escoge vs flujo de trabajo Combinar
- 3. ¿Flujo de trabajo de Python 3?
- 4. Flujo de trabajo de Erlang
- 5. Mejor flujo de trabajo PHP
- 6. Git flujo de trabajo básico
- 7. Flujo de trabajo con Symfony2?
- 8. Ejemplo simple de oozie de consulta de colmenas?
- 9. ¿Cómo manejan oozie las dependencias?
- 10. JIRA, agregue un flujo de trabajo a un esquema de flujo de trabajo?
- 11. Flujo de trabajo Sharepoint frente al flujo de trabajo de Windows
- 12. Flujo de trabajo de subprogramas de Git
- 13. Prueba de unidad de flujo de trabajo
- 14. Flujo de trabajo de prueba de Haskell
- 15. ¿Flujo de trabajo eficiente de Clojure?
- 16. Flujo de trabajo de desarrollo web SVN
- 17. Flujo de trabajo de IPython (editar, ejecutar)
- 18. ¿Qué motor de flujo de trabajo elegir?
- 19. Flujo de trabajo de MDM en Android
- 20. Flujo de trabajo usando virtualenv y pip
- 21. Eclipse EGit flujo de trabajo recomendado
- 22. Mejor flujo de trabajo con Git & Github
- 23. Git, SVN y Eclipse flujo de trabajo
- 24. ¿Funcionará este flujo de trabajo git-svn?
- 25. Flujo de proceso/trabajo en Java
- 26. Flujo de trabajo UTF8 PHP, MySQL resume
- 27. Se requiere software de edición de flujo de trabajo - recomendación
- 28. Cascading Soft Delete
- 29. Flujo de trabajo estándar cuando se trabaja con JPA
- 30. herramienta para convertir C++ código fuente de diagrama de flujo