Tarea:
a agruparse una gran piscina de fragmentos cortos de ADN en las clases que comparten sub-secuencia de patrones comunes y encontrar el secuencia de consenso de cada clase.racimo corto, cadenas homogéneas (ADN) de acuerdo con sub-patrones comunes y extraer consenso de las clases
- Piscina: ca. 300 secuencia de fragmentos
- 8 - 20 letras por fragmento
- 4 posibles letras: A, G, T, C
- cada fragmento está estructurado en tres regiones:
- 5 cartas genéricas
- 8 o más posiciones de g de y
- 5 cartas genéricas de c
(Como expresión regular que sería[gcta]{5}[gc]{8,}[gcta]{5}
)
plan:
para llevar a cabo una alineación múltiple (es decir, withClustalW2) para encontrar clases que compartan secuencias comunes en la región 2 y sus secuencias de consenso.
Preguntas:
- son mis fragmentos demasiado corto, y habría que ayudará a aumentar su tamaño?
- ¿La región 2 es demasiado homogénea, con solo dos tipos de letra permitidos, para mostrar los patrones en su secuencia?
- ¿Qué métodos o herramientas alternativas puede sugerir para esta tarea?
Saludos,
Simon
Esta es una visión muy interesante sobre el tipo de cosas que * bioinformática * hace con las secuencias de ADN. Yo lo hubiera votado, pero la flecha dice "esta pregunta es útil y clara", no "esta es una pregunta interesante". – pavium
¿De dónde vienen los fragmentos de ADN y qué intentas representar? Es difícil saber qué tan corto es "demasiado corto" sin más información. Además, ¿qué intentas representar y qué quieres decir con "mostrar patrones en la secuencia"? –
Quiero saber si existe un consenso dentro de las regiones GC entre los fragmentos. De modo que puedo decir: los fragmentos no solo contienen una repetición GC, sino que la repetición GC también muestra un patrón común (si es que realmente lo hace). Los fragmentos son simplemente repeticiones GC elegidas al azar (más un marco de sus 10 bases vecinas más cercanas, esto puede ser, por supuesto, cambiado o eliminado) del genoma humano. – SimonSalman