Características comunes a todos los sabores regex?

He visto muchas cosas en común en las capacidades regex de diferentes herramientas/idiomas habilitados para expresiones regulares (por ejemplo, perl, sed, java, vim, etc.), pero también tengo muchas diferencias.Características comunes a todos los sabores regex?

¿Existe un estándar subconjunto de capacidades de expresiones regulares compatibles con todas las herramientas/idiomas habilitados para expresiones regulares? ¿Cómo varían las capacidades de expresiones regulares entre herramientas/idiomas?

Fuente

2008-08-27 Ben Lever

Compare Sabores de expresiones regulares

http://www.regular-expressions.info/refflavors.html

Fuente

2008-08-27 13:08:30

http://en.wikipedia.org/wiki/Comparison_of_regular_expression_engines
aún más detallada: http://www.regular-expressions.info/refflavors.html

Fuente

2008-08-27 13:07:45 kokos

Si tomó la gramática grep expresión regular, no el egrep uno, o la gramática de expresiones regulares sed y utilizó ese deberías estar usando un subconjunto seguro en muchas plataformas y herramientas.

Lo único que puede morderte entonces es cuando cambias entre las implementaciones de expresiones regulares usando Automatizaciones de estado finito (FSA) y las que usan retroceso, p. Ej. las implementaciones del cuantificador variarán de grep a Perl.

Las implementaciones basadas en FSA encontrarán la coincidencia más larga comenzando en la primera posición posible. Los que retroceden encontrarán la primera coincidencia sesgada hacia la izquierda, comenzando en la primera posición posible. Es decir, probará cada rama en el orden del patrón hasta que se encuentre una coincidencia.

Considere la cadena "xyxyxyzz", y el patrón "(xy)*(xyz)?". Los motores basados en FSA coincidirán con la subcadena más larga posible, "xyxyxyz". Los motores basados en seguimiento posterior coincidirán con la primera subcadena sesgada a la izquierda, "xyxyxy".

Fuente

2008-08-27 13:14:23

"autómata de decisión no finito". Mi computadora solo tiene memoria finita; ¿cómo tiene un infinito $ THING? Creo que podría querer decir s/finite/deterministic/g. –

mayoría de las herramientas de expresiones regulares/soporte de lenguajes de estos basic capabilities:

carácter Clases/Sets y su negación - []
Anclas -^$
Alternancia - |
Cuantificadores -? + * {N, m}
Metacaracteres - \ w, \ s, \ d, ...
referencias hacia atrás - \ 1, \ 2, ...
Dot -.
modificadores simples como/gy/i for global e ignorar caso
Caracteres Escapar

Más herramientas avanzadas/soporte de lenguajes:

búsquedas hacia delante y traseros
clases de caracteres POSIX
Límites de palabras
Interruptores en línea como permitir la inserción de casos nsitivity por sólo una pequeña parte de la expresión regular
como modificadores/x para permitir formatear y comentarios extra/m para multilínea
Named Captura
Unicode

Fuente

2008-08-27 13:15:30

Algunas implementaciones simples (por ejemplo, en Scintilla/SciTE) ni siquiera admiten la alternancia o algunos cuantificadores (? Y {}). – PhiLho

No hay motor estándar. Sin embargo, el formato POSIX de expresión regular extendida es un subconjunto válido de la mayoría de los motores y probablemente esté lo más cerca posible de un subconjunto estandarizado.

Fuente

2008-08-27 13:17:22

Ver la sintaxis de expresiones regulares de emacs: http://www.gnu.org/software/emacs/manual/html_node/emacs/Regexps.html#Regexps.

Recuerdo leer que la sintaxis de emacs es inamovible (por razones de compatibilidad con versiones anteriores), así que si quieres ser compatible con todo, haz que todo sea compatible con esto. Algunas herramientas pueden ser compatibles, otras no.

Si bien tiene un objetivo digno, creo que será extremadamente difícil de alcanzar, y también he encontrado que las expresiones regulares de emacs son un dolor para trabajar. ¿Tal vez el 99% de todo es lo suficientemente bueno si te hace más feliz y más productivo?

Fuente

2009-05-18 13:47:50

Características comunes a todos los sabores regex?

Respuesta

Cuestiones relacionadas