Básicamente, estoy buscando específicamente un código de 4 dígitos dentro de dos corchetes angulares dentro de un archivo de texto. Sé que necesito abrir el archivo de texto y luego analizarlo línea por línea, pero no estoy seguro de cuál es la mejor manera de estructurar mi código después de marcar "para línea en archivo".¿Cómo busco un patrón dentro de un archivo de texto usando Python combinando operaciones de expresiones regulares y cadenas/archivos y almacenando instancias del patrón?
Creo que de alguna manera puedo dividirlo, quitarlo, o particionarlo, pero también escribí una expresión regular que utilicé compilar y si eso devuelve un objeto coincidente no creo que pueda usar eso con esa cadena operaciones basadas Además no estoy seguro de si mi expresión regular es suficiente o no codicioso ...
me gustaría para almacenar todas las instancias de esos golpes que se encuentran como cadenas o bien dentro de una tupla o una lista.
Aquí es mi expresión regular:
regex = re.compile("(<(\d{4,5})>)?")
No creo que tenga que incluir todo lo que mucho código teniendo en cuenta su muy básicos hasta el momento.
¿Su archivo es demasiado grande para mantener todo en la memoria al mismo tiempo? – Josiah
¿El uso final de esto es un módulo que devuelve una lista o tupla con la que se puede comparar? Por lo tanto, no estoy seguro, pero ese es el uso final que me gustaría tener. –
Bueno, está la función re.findall() que devuelve una lista de todas las coincidencias en el archivo, por lo que si lees el archivo en una cadena (.read()) puedes ejecutar eso en él y te da una lista de objetos de partido Sin embargo, si el archivo es demasiado grande para la memoria, necesitaría leerlo una línea a la vez (o como quiera que quiera dividirlo) – Josiah