Lo que quiero hacer es realizar una consulta y obtener resultados que no distinguen entre mayúsculas y minúsculas y que coinciden con palabras parciales del índice.Uso de varios tokenizadores en Solr
Tengo un esquema de Solr configurado en el momento que se ha modificado para que pueda consultar y devolver los resultados sin importar el caso. Entonces, si busco iPOd, veré el iPod devuelto. El código para hacer esto es:
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>
</analyzer>
...
</fieldType>
He encontrado el código que nos permitirá hacer una consulta coincidencia de palabra parcial, pero no creo que puedo tener dos tokenizers en un campo.
<fieldType name="text" class="solr.TextField" >
<analyzer type="index">
<tokenizer class="solr.NGramTokenizerFactory" minGramSize="3" maxGramSize="15" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
...
</fieldType>
Entonces, ¿qué puedo hacer para realizar esta tokenizer en el campo, así?
¿O hay alguna forma de fusionarlos?
¿O hay otra forma en que pueda lograr esta tarea?
Pero ¿cómo ahora consultar eso para que los resultados se vean en los datos que se tokenized con ambos tokenizers? En otras palabras, ¿cómo obtener resultados de ambos tokenizers a la vez? –