¿Puedo integrar el rastreador Apache Nutch con el servidor Solr Index?Uso del rastreador Nutch con Solr
Editar:
Uno de nuestros desarrolladores se le ocurrió una solución a partir de estos puestos
respuesta
Sí
¿Puedo integrar el rastreador Apache Nutch con el servidor Solr Index?Uso del rastreador Nutch con Solr
Editar:
Uno de nuestros desarrolladores se le ocurrió una solución a partir de estos puestos
respuesta
Sí
Todavía es un open issue. Si te sientes aventurero podría intentar aplicar esos parches a sí mismo, aunque parece que it's not so simple
Si usted está dispuesto a actualizar a Nutch 1.0 se puede utilizar el solrindex como se describe en este artículo de Lucid Imagination: http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/.
ese es el artículo definitivo para nutch/solr –
nutch 2.x está diseñado para usar solr por defecto. Puede seguir los pasos en http://wiki.apache.org/nutch/Nutch2Tutorial, o una instrucción mejor en el libro "Web Crawling and Data Mining with Apache Nutch".
ya estoy preparando una charla de grupo de usuarios en lucene, así que probaré esta configuración. Esperaba que haya una respuesta rápida de Y/N por ahí –