Estoy tratando de dividir una cadena en caracteres de nueva línea (para los caracteres de nueva línea del archivo de texto de Windows, OS X y Unix). Si hay una sucesión de estos, quiero dividirlos también y no incluir ningún en el resultado.Regex para dividir en sucesiones de caracteres de nueva línea
Así, para cuando se dividen los siguientes:
"Foo\r\n\r\nDouble Windows\r\rDouble OS X\n\nDouble Unix\r\nWindows\rOS X\nUnix"
El resultado sería:
['Foo', 'Double Windows', 'Double OS X', 'Double Unix', 'Windows', 'OS X', 'Unix']
Qué expresiones regulares se debe usar?
¿Le preocupa otros espacios en blanco vertical? \ r \ n es DOS, pero todavía hay otros espacios en blanco verticales posibles, como la pestaña vertical y Unicode NBSP, PS, LS, NNBSP. Es posible que desee comprobar si Python admite el concepto de línea nueva genérica. Perl tiene \ v y \ R que coinciden con cualquier espacio en blanco vertical genérico o salto de línea, respectivamente. De lo contrario, si desea los caracteres Unicode, agréguelos a sus clases de caracteres [\ r \ n] + y el equivalente de Python para buscar esos caracteres Unicode. – dawg