2010-05-26 21 views

Respuesta

2

Para obtener texto en Solr, necesita poder extraerlo. Lucene Connector Framework está destinado a hacer justamente eso. Si de alguna manera obtiene el texto sin procesar de otra manera, puede usar el DataImportHandler para importar información. Si indiza el texto correctamente y configura bien el esquema, debería poder obtener resultados de búsqueda exitosos.

+0

¿Dónde encaja el filtro Apache Tika aquí? –

+0

No estoy seguro de que lo haga. En cuanto a los formatos de documentos compatibles con Tika: http://tika.apache.org/formats.html, admite varios formatos de documentos de Microsoft. No sé cuáles de estos son relevantes para Sharepoint. Idealmente, Tika le permite extraer texto y metadatos de un archivo en un formato compatible, para que pueda personalizar el manejo del repositorio (sistema de archivos, directorios, rastreo). ¿Pero por qué no usar el LCF? –

+0

Sí, seguí adelante con el uso de LCF, ¿LCF se ocupará de la búsqueda de texto completo? –

Cuestiones relacionadas