Cuando impregno un objeto regex con una configuración regional particular, ¿cómo afecta el comportamiento de coincidencia? ¿Afecta la intercalación o cualquier otra cosa? Parece que no puedo encontrar una explicación en ningún lado.comportamiento específico de la configuración regional en la biblioteca de expresiones regulares?
19
A
Respuesta
42
Afecta al menos lo siguiente:
- Colación: la expresión regular
[a-f]
imbuido de un entorno local francés debe coincidir con la dirección carácter. - Del mismo modo,
\w
en una localidad finlandesa debe coincidir con el carácter ä (pero[a-z]
debe no, como A, A y O cotejar después de z en finlandés. En alemán, sin embargo,[a-z]
concuerden con un.) - En una configuración regional compatible con Unicode, se debe usar el algoritmo Unicode equivalence, de modo que las formas compuestas de un carácter coincidan con una forma descompuesta y viceversa.
- Con un sabor de expresiones regulares compatible con POSIX (básico, extendido, awk, grep y egrep), el POSIX character classes debe tener en cuenta la configuración regional:
[=e=]
debe coincidir con é en una configuración regional francesa pero no en una configuración regional en inglés.
3
En la configuración regional, tenga en cuenta que "ch" y "ll" ya no se consideran letras solas en el alfabeto, ya que esto fue modificado por las entidades pertinentes. No he podido encontrar la fecha exacta, pero en este momento "ch" y "ll" son dos letras:
http://en.wikipedia.org/wiki/Ll
Creo implementaciones ahora reflejan ese hecho.
Cuestiones relacionadas
- 1. Diéresis en correspondencia con expresiones regulares (¿mediante la configuración regional?)
- 2. Configuración de la configuración regional de Java
- 3. Obtener la cadena de la configuración regional predeterminada mediante una cadena en la configuración regional específica
- 4. expresiones regulares (expresiones regulares), reemplace la segunda aparición en javascript
- 5. cambiar la configuración regional de la fecha
- 6. comportamiento de los espacios en blanco de expresiones regulares grep
- 7. "atof" independiente de la configuración regional?
- 8. ¿Depende de la configuración regional SimpleDateFormat?
- 9. ¿Falta la configuración regional en Java?
- 10. Cambiar la configuración regional predeterminada en Symfony2
- 11. La configuración regional no existe en Java
- 12. Can isdigit legítimamente depende de la configuración regional en C
- 13. Cambiar la configuración de idioma (configuración regional) para el dispositivo
- 14. Configuración regional en Android
- 15. de expresiones regulares para la validación URL
- 16. creando la matriz de expresiones regulares Javascript
- 17. En expresiones regulares, haga coincidir el final de la cadena o un carácter específico
- 18. expresiones regulares MySQL en la cláusula where
- 19. Expresiones regulares: Buscar en la lista
- 20. Implementación de strtod independiente de la configuración regional
- 21. ¿Tiene C o C++ una biblioteca de expresiones regulares estándar?
- 22. Git GUI: cómo cambiar la configuración regional
- 23. Formateo de direcciones basado en la configuración regional en android
- 24. Cambiar la configuración regional en tiempo de ejecución en Swing
- 25. String.Format considere la configuración regional o no?
- 26. Grails cómo cambiar la configuración regional actual
- 27. C++: ¿qué biblioteca de expresiones regulares debería usar?
- 28. Significado de (?) En expresiones regulares
- 29. Limitaciones de expresiones regulares?
- 30. Compilador de expresiones regulares
Vea también http://stackoverflow.com/q/10540305/83805 –
@DonStewart: Solo estaba interesado en C++ específicos. El comportamiento específico de la localidad no es necesariamente el mismo en todas partes que imagino. –
La configuración regional afecta a los motores regex que cumplen con POSIX, que es al menos el punto de partida para la mayoría de las bibliotecas de expresiones regulares. –