2010-07-05 42 views
21

¿Hay algún paquete que contenga la función de conteo de distancia Levenshtein que se implementa como un código C o Fortran? Tengo muchas cadenas para comparar y stringMatch de MiscPsycho es demasiado lento para esto.Fast Levenshtein distancia en R?

Respuesta

16

levenshteinDist (del paquete RecordLinkage) llama al código C compilado. Darle una oportunidad.

5

Usted podría intentar stringDist de Biostrings así

12

Y stringdist en el paquete stringdist tampoco demasiado, incluso más rápido que levenshteinDist bajo ciertas condiciones (1)

+0

stringdist ha acelerado significativamente desde que el blog se vincula a : ahora usa múltiples núcleos. –

Cuestiones relacionadas