Espero que estoy redactando esto correctamente para transmitir lo que estoy buscando.Cómo determinar una cadena de ADN para la semejanza a otra
Necesito comparar dos textos. Si las dos cadenas son iguales, me gustaría obtener puntajes que sean muy parecidos, si las cuerdas son muy diferentes, necesito puntajes muy diferentes.
Si tomo un hash md5 de un correo electrónico y cambio un carácter, el hash cambia drásticamente. Quiero que algo no cambie demasiado. Necesito comparar cómo se parecen dos piezas de contenido sin almacenar la cadena.
Actualización: Estoy buscando ahora la combinación de algunas ideas de los diversos enlaces que las personas han proporcionado. Idealmente, me gustaría tener una sola función de entrada para crear mi puntaje, así que estoy buscando usar una cadena de referencia para comparar siempre mi entrada. También estoy buscando tomar personajes asci y sugerirlos. Todavía leyendo todos los enlaces provistos.
¿Qué quiere decir con "puntuación"? ¿Te refieres a una clasificación de cuán cerca están las cuerdas entre sí? Pero su tercer párrafo suena más como si estuviese buscando un valor tipo hash que sea robusto para pequeños cambios ("hash robusto" es el término para tales herramientas, a menudo se usa para audio e imágenes más que para cadenas). – SPWorley