Un poco más de la especificidad de su problema exacto sería bueno. Hay muchas técnicas diferentes que puedes usar. Muchos de estos son impulsados por otros datos. Por supuesto, puede usar Lucene y crear sus propios índices. Hay enlaces para muchos idiomas a lucene. Avanzando hacia arriba también está el proyecto Solr que es Lucene con muchas herramientas y funcionalidad adicional a su alrededor. Eso puede estar más en la línea de lo que estás buscando.
La intención es engañosa y los motores de búsqueda más modernos confían en la intención estadística para ayudar en el orden de los resultados. Siempre puede tener un botón útil para este artículo y almacenar el texto de consulta que conduce a documentos útiles. Luego, podría agregar una capa de información al índice para impulsar palabras o frases específicas y ayudarlas a señalar ciertos documentos.
Algunas cosas en que pensar ... ¿Cuántos documentos? ¿Cuál es la duración promedio? ¿Se actualizan con frecuencia? ¿Qué hacen los usuarios con los documentos? ¿Cómo se ve la propagación de palabras únicas a los documentos? (Más simplemente, es fácil hacer coincidir una consulta con un documento específico basado en características únicas comunes).
Si está en la web, siempre puede hacer un motor de búsqueda personalizado de Google que solo busque en su sitio aunque usted puede encontrar esto como subóptimo por una variedad de razones.
Siempre puede comenzar con un índice simple y gradualmente hacerlo más sofisticado hablando con los usuarios y capturando datos.