Actualmente estoy trabajando con el uso de SecondString para la coincidencia de cadenas difusas, donde tengo un diccionario grande para comparar (con cada entrada en el diccionario tiene un identificador no único asociado)) Actualmente estoy usando un hashmap para almacenar este diccionario.Mejorar el rendimiento de la coincidencia de cadenas difusas en un diccionario
Cuando quiero hacer una coincidencia de cadenas difusas, primero compruebo si la cadena está en el hashMap y luego repito todas las demás teclas potenciales, calculando la similitud de cadena y almacenando los k, v pair/s con la mayor similitud. Dependiendo de qué diccionario estoy usando esto puede llevar mucho tiempo (12330 - 1800035 entradas). ¿Hay alguna forma de acelerar esto o hacerlo más rápido? Actualmente estoy escribiendo una función/tabla de memorización como una forma de acelerar esto, pero ¿alguien más puede pensar en una mejor manera de mejorar la velocidad de esto? Tal vez una estructura diferente o algo más que me estoy perdiendo.
Muchas gracias de antemano,
Nathan
Al ser una cuestión técnica , esto pertenece a [StackOverflow] (http://stackoverflow.com/). –