2011-02-03 10 views
5

Quiero implementar una solución de búsqueda para un sitio web escrito en Django. De las opciones disponibles (he investigado Solr, Sphinx, Xapian, PostgreSQL/Tsearch3, MySQL) Sphinx se ve como el más bonito. Sin embargo, no es compatible con la derivación del polaco, y ese es el idioma de los datos que quiero que se puedan buscar.Polaco para la búsqueda de Sphinx?

¿Cuáles son las mejores formas de manejar idiomas no compatibles en Sphinx? Tengo la intuición de que podría crear un corpus de origen del diccionario Ispell. ¿Cómo puedo hacer que eso funcione con Sphinx?

Respuesta

0

Buscar en http://snowball.tartarus.org/ mailist, puede encontrar información si alguien intentó crear una cera polaca. Hay 2 láminas libres disponibles, pero están hechas en java (creo que al menos una está hecha para solr/lucene). De Ispell, no estoy seguro de si el corpus stemming puede ayudarlo, podría crear archivos para usar en forma de palabra o exceptts.

Cuestiones relacionadas