Soy consciente de los duplicados de esta pregunta:¿Cómo se aproxima "Quiso decir?" sin usar Google?
- How does the Google “Did you mean?” Algorithm work?
- How do you implement a “Did you mean”?
- ... y muchos otros.
Estas preguntas están interesadas en cómo funciona realmente el algoritmo. Mi pregunta es más parecida a la siguiente: supongamos que Google no existía o que tal vez esta característica no existía y no contamos con la participación del usuario. ¿Cómo se puede implementar una versión aproximada de este algoritmo?
¿Por qué es esto interesante?
Ok. Pruebe a escribir "qualfy" en Google y le dice:
¿Se refiere a:calificar suficiente
Feria. Utiliza Statistical Machine Learning en datos recopilados de miles de millones de usuarios para hacer esto. Pero ahora intente introducir esto: "Trytoreconnectyou" en Google y le dice:
¿Se refiere a:intentar volver a conectar Usted
Ahora bien, esta es la parte más interesante. ¿Cómo determina Google esto? Tener un diccionario a mano y adivinar las palabras más probables de nuevo con la entrada del usuario? ¿Y cómo diferencia entre una palabra mal escrita y una oración?
Ahora, considerando que la mayoría de los programadores no tienen acceso a las entradas de miles de millones de usuarios, estoy buscando la mejor forma aproximada de implementar este algoritmo y qué recursos están disponibles (conjuntos de datos, bibliotecas, etc.). ¿Alguna sugerencia?
@Benjamin: ¿También puedo tener una lista de conjuntos de datos que pueden aprovecharse? No soy de este dominio, por lo que cualquier ayuda adicional será una bendición. – Legend
¿Has leído las respuestas a los enlaces que publicaste? La segunda respuesta al primer enlace apunta a http://norvig.com/spell-correct.html que es más o menos exactamente lo que estás buscando. – Gabe
posible duplicado de [¿Cómo se entiende Google? ¿Algoritmo?] (Http://stackoverflow.com/questions/307291/how-does-the-google-did-you-mean-algorithm-work) – Gabe