Estoy tratando de crear un sistema de reconocimiento óptico de caracteres con el diccionario.OCR: distancia Levenshtein ponderada
De hecho no tengo un diccionario aplicado todavía =)
He oído que hay indicadores simples basados en Levenstein distancia que toman en cuenta diferentes distancias entre los diferentes símbolos. P.ej. 'N' y 'H' están muy cerca uno del otro y d ("TEATRO", "TNEATRE") debe ser menor que d ("TEATRO", "TOEATRE"), lo cual es imposible usando la distancia básica de Levenstein.
¿Podría ayudarme a encontrar esa métrica, por favor?
Tanques para la atención.
Lamentablemente no es lo que estaba buscando. De todos modos ya me gradué con honores, y ya no necesito una solución =) – leshka
Eso es extraño, porque su propósito es exactamente lo que pediste. – briantyler
hmmm .. He revisado tu enlace. Pero lo que he entendido es que simplemente agregaron una operación más: la transposición. Donde la transposición es cuando cambias dos símbolos vecinos. Si me equivoco, ¿podría especificar el lugar en la página de la wiki en el que están hablando de la distancia entre letras diferentes? – leshka