Estoy tratando de comprender los pasos básicos del algoritmo FASTA al buscar secuencias similares de una secuencia de consulta en una base de datos. Estos son los pasos del algoritmo:Algoritmo FASTA Explicación
- Identificar k-palabras comunes entre I y J
- diagonales partido en el k-palabra coincide, identificar 10 mejores diagonales
- regiones iniciales Rescore con una matriz de puntuación de sustitución
- Únete regiones iniciales usando lagunas, penalizar por lagunas
- Realizar la programación dinámica para encontrar alineaciones finales
Estoy confundido con el 3er y 4to paso en el uso de la matriz de puntaje PAM250, y cómo "unirme usando huecos".
¿Alguien me puede explicar estos dos pasos "lo más específicamente posible". Gracias