2010-11-01 21 views
5

Quiero saber cómo funciona el "¿Quiso decir: ..." de Wikipedia y si hay alguna manera, como con la API, de usarlo? Porque quiero obtener la página correspondiente de mi entrada, pero esta podría incluir errores. Example. ¿Hay alguna consulta que devuelva directamente la sugerencia?Wikipedia: ¿Cómo "quiso usted decir" con las obras y cómo explotarlas?

Gracias por su ayuda.

+0

Un hecho interesante es que a veces la misma consulta de búsqueda te hace diferente 'quieres decir' si estás en proyectos diferentes (incluso si son del mismo idioma) – BenMQ

+0

Las sugerencias se basan en las probabilidades dadas por otros usuarios que cometieron el mismo error ortográfico. [Este foro] (http://www.quora.com/How-does-the-Wikipedia-did-you-mean-algorithm-work) brinda un ejemplo simple de cómo un algoritmo de aprendizaje automático podría calcular estas probabilidades. –

Respuesta

3

(no estoy segura de detalles de implementación de Wikipedia, pero esta es una manera de hacerlo)
Probablemente utiliza un phonetic algorithm, como Soundex y la compara con una base de datos precalculados.
PHP ofrece algunos algoritmos fonéticos incorporados si desea jugar con ellos.

2

Esto viene bajo "recuperación de información" en ciencias de la computación. Lucene es la biblioteca de código abierto que implementa estos conceptos y podría ser la biblioteca que está buscando. Para obtener más detalles sobre la recuperación de información, puede buscar en Google. Para obtener detalles específicos sobre cómo "Quiso decir" puede ser implementado utilizando Lucene, pasar por el siguiente enlaces

Cuestiones relacionadas