2010-04-29 15 views
5

Estoy tratando de usar Mahout en una aplicación que se ejecuta en Windows. Quiero construir clusters a partir de un índice lucene usando k-means.¿Cómo usar Mahout en un entorno Windows?

Tan pronto como tengo que crear archivos de secuencia (creando vectores a partir de un índice lucene), obtengo una Excepción Hadoop, ya que Hadoop realiza llamadas de línea de comandos a programas desconocidos en un entorno Windows (por ejemplo, chmod). Correr en Cygwin no es una opción, ya que quiero poder ejecutar la aplicación desde eclipse.

Entonces mi pregunta es

  • ¿hay alguna manera de evitar tener que crear archivos de secuencia para recuperar mis vectores de un índice lucene?
  • o hay una manera de crear archivos de secuencia en un entorno de Windows?
  • Respuesta

    4

    La única manera en que puede ejecutar Hadoop en un entorno Windows es instalar Cygwin. Para obtener más información, consulte esta entrada del blog:

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin le brindarán todos los servicios públicos de línea de comandos (como chmod) que se basa en Hadoop. Aún puede ejecutar sus trabajos de Hadoop desde Eclipse si lo desea.

    +0

    En segundo lugar, esta es más una pregunta acerca de Hadoop, y no, no se puede ejecutar Hadoop en Windows. –

    +0

    HDInsight es una implementación de Hadoop para Windows Azure. Si desea utilizarlo en su máquina local y no en la nube, intente utilizar el emulador HDInsight, que puede instalar con Web Platform Installer. – user888734

    +0

    Es posible que desee actualizar su respuesta, ya que ahora es posible usar Hadop con Windows (https://wiki.apache.org/hadoop/Hadoop2OnWindows). Con gusto responderé, pero todavía estoy buscando una forma de usar Mahout :) – fxm

    0

    Puede utilizar una máquina virtual para ejecutar su entorno Hadoop. En cuanto a mí, la mejor solución es usar el proyecto http://hortonworks.com/. Todo funciona bien.

    Cuestiones relacionadas