Luchando con RE para buscar secuencias 'TAA' (trillizos de 3 caracteres) 'TAA' de nuevo.expresión regular de Python con los codones
He intentado lo siguiente:
re.findall('TAA...+?TAA',seq)
que por supuesto no da trillizos, pero me da secuencias
re.findall('TAA([ATGC]{3})+?TAA' , seq)
sin embargo me da una lista como salida
'AGG', 'TCT', 'GTG', 'TGG', 'TGA', 'TAT',
¿Alguna idea? A medida que por supuesto puede comprobar la salida de
re.findall('TAA...+?TAA',seq)
si la longitud% 3 == 0, pero la forma de hacer esto con RE?
¿Es TAA TAA TAA una captura válida (TAA estar fuera de la casualidad también el triplete medio de 3 caracteres)? –