Tengo problemas con mi expresión regular para capturar palabras consecutivas en mayúscula. Aquí es lo que yo quiero la expresión regular para capturar:Obtenga palabras en mayúscula consecutivas usando regex
"said Polly Pocket and the toys" -> Polly Pocket
Aquí es la expresión regular que estoy utilizando:
re.findall('said ([A-Z][\w-]*(\s+[A-Z][\w-]*)+)', article)
Devuelve el siguiente:
[('Polly Pocket', ' Pocket')]
quiero que vuelva :
['Polly Pocket']
Entonces, ¿qué si la entrada fue ' Tengo una cadena y es larga' ¿Debería dar '['Tener una cadena', 'Es larga']' o '['Tener una cadena y es larga'] ' –
¿Por qué tiene la palabra" dicho "en su lista completa? ¿Realmente tiene la intención de encontrar palabras capitales consecutivas después de "dicho"? – jgritty