Tengo dos instancias de Jackrabbit que contienen el mismo contenido. Reconstruir el índice de Lucene es lento, más de 30 horas, y el tiempo de inactividad necesario en el clúster es arriesgado. ¿Es posible simplemente volver a indexar una Jackrabbit y luego copiar el índice de Lucene de esa instancia a la otra?Copiar índices de Lucene entre los repositorios de Jackrabbit
La copia ingenua de los archivos de índice de Lucene debajo del directorio de espacio de trabajo no funciona. El problema parece ser que el contenido está indexado por el número de documento que se asigna a un UUID que se asigna a la ruta JCR para el nodo indexado, pero estos UUID no son estables para una ruta determinada entre las instancias de Jackrabbit. (Ambas son en realidad instancias de editores de Day CQ pobladas por replicación de una instancia de autor de CQ).
He logrado encontrar la asignación de UUID a ruta en el repositorio en/jcr: system/jcr: versionStorage/pero No veo una manera fácil de copiar esto entre repositorios junto con el índice Lucene. Y luego no puedo encontrar el UUID-> identificación del documento en ninguna parte de los archivos. ¿Esto también forma parte del índice Lucene?
Gracias por cualquier ayuda. Me inclino por simplemente volver a indexar la segunda instancia por separado y aceptar el tiempo de inactividad, ¡pero apreciamos cualquier idea para reducir el riesgo o el tiempo transcurrido de reindexación del clúster!
Al final vamos la re-index-les-tanto de rutas: hemos conseguido reutilizar una instancia de prueba como un ejemplo vivo extra que podemos caer en la granja temporalmente mientras tomamos el otros dos a su vez para volver a indexar. Sin embargo, ¡aún estaría interesado en escuchar mejores formas de hacerlo!
Eche un vistazo a esta publicación, aunque tal vez ya la haya visto. http://stackoverflow.com/questions/670182/index-replication-and-load-balancing –
Gracias. No, no creo que ninguno de ellos sea relevante para mí: es el motor de búsqueda integrado, así que no puedo cambiar a Solr y al disco de otras respuestas copiando los archivos de índice, lo cual no es suficiente para mí. Necesito combinar de algún modo los datos de ruta de nodo con el índice y copiar eso, luego reconstruir la ruta -> UUID -> mapeo de número de documento en el otro, o de alguna manera transformar el índice copiado para usar los números de documento en el sistema de destino en el sistema fuente – Rup