2010-02-21 20 views
6

Estoy en proceso de crear un sitio web corporativo. Estamos buscando cualquier motor de búsqueda de código abierto o pago basado en ASP.NET. Debería poderMotor de búsqueda ASP.NET

  1. Buscar contenido web de todas las páginas del sitio.
  2. Todos los documentos de Office. etc.
  3. Si tenemos algunos filtros Searach reseults basados ​​en el tipo de usuario y styff.

Háganme saber qué tipo de herramientas o software debemos tener en cuenta.

Respuesta

7

Trate Lucene.NET

Apache Lucene es un alto rendimiento, motor de búsqueda de texto con todas las funciones librería escrita completamente en Java. Es es una tecnología adecuada para casi cualquier aplicación que requiera búsqueda de texto completo, especialmente multiplataforma.

Lucene.Net es un código fuente, clase por clase, API-per-API y puerto algorithmatic del motor de búsqueda de Java Lucene a la C# y .NET plataforma .NET utilizando Microsoft marco.

Estos son algunos enlaces de tutoriales para empezar:

2

Solr es otra gran opción, es efectivamente una fachada en la cima de lucene que le proporciona una buena API basada en REST/url. También hay una biblioteca .Net madura disponible para trabajar con ella.

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

Desde su pregunta, sin embargo, usted está buscando para el motor subyacente real o ¿Está buscando algo que también arrastrarse/Traverse su contenido de la construcción de los índices de su motor de búsqueda elegido?

-

edición para Responder al comentario de su creador original.

Tienes que resolver dos mitades de una ecuación.

Lo primero es elegir un motor de búsqueda que responda a las entradas (palabras clave) y luego consulte sus índices y devuelva lo que cree que corresponde. La segunda mitad de la ecuación es encontrar un mecanismo para poblar el índice de búsqueda de su motor elegido.

En lo que respecta al motor, se ha sugerido Lucene, y sugerí una variante de Lucene que proporciona una interfaz de desarrollador (posiblemente) mejorada.En términos de construir su corpus de búsqueda, eso es un poco diferente. Aquí puede optar por escribir su propio software que toma un contenido y lo agrega al índice. La ventaja aquí es que tiene control de grano fino de lo que entra en el motor de búsqueda y cuándo. El inconveniente es que estás escribiendo un nuevo código; afortunadamente, los motores de búsqueda modernos como Lucene/Solr lo hacen bastante fácil.

Su segunda opción es usar algo para rastrear automáticamente su contenido y agregarlo al índice. Los problemas aquí son identificar y aprender a configurar una opción apropiada. Dependiendo de su elección de rastreadores, puede o no hacer un buen trabajo de indexación de documentos en un sistema de archivos (por ejemplo, en un sitio corporativo Sharepoint).

Nutch es un rastreador de Apache (fabricantes de Lucene y Solr) que podría utilizarse si optas por no escribir tu propio código. http://wiki.apache.org/nutch/

+0

Estamos construyendo un sitio corporativo. Donde cualquier visitante del sitio debería poder buscar todo el contenido web. – user171523

Cuestiones relacionadas