2008-09-24 10 views

Respuesta

11

SOUNDEX es de hecho orientado al inglés. Otros dos que tienen en cuenta una variedad más amplia de diferencias fonéticas son: Double Metaphone y NYSIIS.

Producen codificaciones en un espacio mucho más grande que SOUNDEX. Double Metaphone, específicamente, incluye reducciones con el propósito expreso de manejar pronunciaciones alternativas basadas en más idiomas que el inglés.

Hice una presentación sobre la coincidencia de cadenas difusas recientemente, the slides puede ser útil.

+1

El enlace a sus diapositivas está roto (404) –

+2

@John: nuevo enlace parece ser http://asymmetrical-view.com/talks/#fuzzy-string-matching – Hace

+1

Gracias, acabo de actualizarlo para señalar a el PDF en el repositorio de github relacionado - Espero que se mantenga más constante. Gracias. –

Cuestiones relacionadas