Nuestro equipo de desarrollo está actualmente investigando la migración de nuestro sistema de búsqueda a Apache Solr, y agradeceríamos mucho algunos consejos sobre la configuración. Estamos indexando aproximadamente doscientas millones de filas de bases de datos. Agregamos alrededor de cien mil filas nuevas durante el día. Estas nuevas filas de bases de datos deben poder buscarse dentro de los dos minutos posteriores a su recepción.Apache Solr Failover Support en Master-Slave Setup
No queremos que la indexación empañe el buscador, por lo que nuestra idea es tener dos servidores Solr ejecutándose en diferentes máquinas en una configuración de replicación. La primera instancia de Solr será el indexador. Utilizará el DataImportHandler para indexar el delta y tendrá habilitado el autocommit para evitar tasas de compromiso demasiado entusiastas. La optimización del índice tendrá lugar durante los períodos programados. La segunda instancia de Solr (el esclavo) será el buscador principal y tendrá sus índices almacenados en unidades de estado sólido RAID.
Lo que nos preocupa es la conmutación por error. Nuestras búsquedas son de misión crítica. Si el buscador principal se cae por alguna razón, nuestro servicio de búsqueda automáticamente desviará las consultas al nodo del indexador. La indexación es igualmente crítica, sin embargo. Si el indexador muere, debemos tener una recuperación de fallas caliente. ¿Existe alguna forma recomendada de automatizar la migración tras error del nodo principal en la replicación de Solr? Empecé a investigar ZooKeeper, pero no estaba seguro de si este era el mejor enfoque.
He intentado utilizar el repetidor como copia de seguridad maestra, pero el repetidor no puede replicarlo en esclavos cuando el maestro principal está inactivo, ¿alguien puede ayudarme? Mi publicación está aquí (https://stackoverflow.com/questions/49079050/solr-repeater-stops-letting-its-slave-polling-from-it-when-its-master-is-down) – wwood