2010-03-24 8 views
5

Para el desarrollo de aplicaciones hadoop, ¿los marcos PHP son menos populares? Si es así, ¿por qué? De lo contrario, señale literatura/documentación/tutoriales para un marco específico? (¡cosas para Symfony serían increíbles!)Desarrollo de aplicaciones Hadoop y PHP

Respuesta

6

Básicamente, Hadoop te permite ejecutar tus propias clases de Java en el clúster para ejecutarlas en los servidores apropiados en los momentos adecuados. Todos los lenguajes que no son lenguajes JVM para Hadoop básicamente implican ejecutar clases java preexistentes, por lo que no es posible nada sofisticado.

Además, hadoop no es realmente un marco interactivo. Está más orientado al procesamiento por lotes de gran cantidad de datos en un tiempo razonable. La regla general es que si el sub trabajo procesa menos de 15 MB en un solo paso, no deberías molestarte con hadoop. La sobrecarga de configurar el trabajo y mezclar datos y resultados te va a matar.

No hay nada que te impida crear tu propia API hadoop para PHP de forma similar cómo se hace para Python. Sin embargo, PHP no es realmente popular entre la multitud que hace el procesamiento de datos a gran escala.

+0

Gracias, Vlad! Aún así, la razón de por qué PHP está fuera de favor con la comunidad hadoop no está claro para mí. Por ejemplo, hay una aplicación Ruby, código abierto, trendingtopics.org que demuestra el uso de hadoop en una aplicación No hay nada equivalente hecho por nadie, ¡esto durante mucho tiempo! Sería bueno saber si hay razones más importantes detrás de la misma. – Arvind

+2

Bueno, qué trendingtopics.org en realidad no está usando Ruby para los propósitos de hadoop. Ruby se usa solo como front-end de la base de datos. La base de datos está poblada por un trabajo hadoop. El trabajo de hadoop está escrito en combinación de colmena y pitón. Aquí está el código http://github.com/datawrangling/trendingtopics/tree/master/lib/scripts/. Es exactamente la aplicación que tenía en mente cuando mencioné enlaces de python. – Vlad

Cuestiones relacionadas