2011-02-24 12 views
9

En un intento por obtener resultados de búsqueda contextualmente más relevantes, he decidido jugar con lucene.net, aunque soy muy nuevo y he descubierto que no es el la biblioteca más intuitiva que he encontrado. Esto no ayuda con la falta de ejemplos relevantes para ayudarme a resolverlo.búsquedas en múltiples campos de Lucene.net

estoy usando simple lucene para construir mi índice y que parece estar funcionando perfectamente:

Field f = null; 
Document document = new Document(); 

document.Add(new Field("id", dl.Id.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED)); 

f = new Field("category", dl.CategoryName.ToLowerInvariant(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS); 
f.SetBoost(5); 
document.Add(f); 

f = new Field("company_name", dl.CompanyName.ToLowerInvariant(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS); 
f.SetBoost(2); 
document.Add(f); 

document.Add(new Field("description", dl.Description.ToLowerInvariant(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS)); 
document.Add(new Field("meta_keywords", dl.Meta_Keywords.ToLowerInvariant(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS)); 
document.Add(new Field("meta_description", dl.Meta_Description.ToLowerInvariant(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS)); 

//And a few more fields 

Sobre la base de este índice que intentaron por primera vez una consulta a lo largo de estas líneas:

var whatParser = new MultiFieldQueryParser(
    global::Lucene.Net.Util.Version.LUCENE_29, 
    new string[] { "company_name", "description", "meta_keywords", "meta_description", "category" }, 
    analyzer); 

whatQuery = whatParser.Parse("search".ToLowerInvariant()); 

Esto funcionó excelente hasta que el término de búsqueda se convirtió en más de 1 palabra. El siguiente fue una consulta de frase.

whatQuery = new PhraseQuery(); 
whatQuery.Add(new Term("company_name", what)); 
whatQuery.Add(new Term("description", what)); 
whatQuery.Add(new Term("meta_keywords", what)); 
whatQuery.Add(new Term("meta_description", what)); 
whatQuery.Add(new Term("category", what)); 

que luego encontré arrojó el error: All phrase terms must be in the same field

Entonces, ¿dónde estoy haciendo mal? ¿Tiene alguna sugerencia sobre cómo solucionarlo? Estoy abierto a cambiar por completo la tecnología de búsqueda si hay mejores sugerencias por ahí.

Parte de la información adicional que puede ser útil

  • Todos los resultados se ordenan en el final a través de new Sort(new SortField[] {new SortField("is_featured", SortField.STRING, true),SortField.FIELD_SCORE})
  • Hay algunos criterios de búsqueda adicionales por lo que se agrega cada consulta a una consulta booleana con ocurren establecido en DEBERÍAN

Gracias por su ayuda.

+0

Hawxby, haga el favor de escribir el código ajustado aquí por referencia –

Respuesta

3

Creo que BooleanClause.Occur.SHOULD es el problema. Lo usamos como esto:

string[] fieldList = { "field1", "field2", "field3"; 

//for us the field list varies .. there are other ways to create this array of course 
List<BooleanClause.Occur> occurs = new List<BooleanClause.Occur>(); 
foreach (string field in fieldList) 
    occurs.Add(BooleanClause.Occur.SHOULD); 

if(!string.IsNullOrEmpty(multiWordPhrase)) 
{ 
    Query q = MultiFieldQueryParser.Parse(multiWordPhrase, fieldList, occurs.ToArray(), new StandardAnalyzer()); 
    return q; 
} 
+0

Después de unos retoques Esto funcionó perfectamente. ¡Gracias! – Hawxby

Cuestiones relacionadas