¿Los "caracteres de control" utilizados en las expresiones regulares difieren mucho entre las diferentes implementaciones de los analizadores de expresiones regulares (por ejemplo, expresiones regulares en Ruby, Java, C#, sed, etc.). Por ejemplo, en Ruby, \D
significa not a digit
; ¿Significa lo mismo en Java, C# y sed? Supongo que lo que estoy preguntando es, ¿existe un "estándar" para las expresiones regulares que todos los analizadores de expresiones regex soportan?¿Hay un subconjunto común/estándar de expresiones regulares?
En caso negativo, ¿hay algún subconjunto común que deba aprenderse y dominarse (y luego aprender los específicos del analizador según se encuentran)?
Creo que la expresión regular POSIX http://en.wikipedia.org/wiki/Regular_expression#POSIX_Basic_Regular_Expressions es el estándar, y diferentes implementaciones se centran alrededor de ella, con algunas variaciones. – sawa