Después de leer un muy buen article sobre optimización de expresiones regulares en java me preguntaba ¿cuáles son los otros buenos consejos para crear expresiones regulares rápidas y eficientes?Sugerencias y trucos de optimización de rendimiento Regex
Respuesta
uso del cualquier (punto) del operador con moderación, si puede hacerlo de otra manera, hacerlo, punto siempre le muerde ...
no estoy seguro de si PCRE es NFA y estoy solo familiarizados con PCRE, pero + y * generalmente son codiciosos por defecto, coincidirán tanto como sea posible para cambiar el uso de + y *? para que coincida con el mínimo posible, tenga en cuenta estas dos cláusulas al escribir su expresión regular.
Sepa cuándo no para usar una expresión regular: a veces una solución codificada a mano es más eficiente y más comprensible.
Ejemplo: suponga que desea hacer coincidir un entero que sea divisible por 3. Es trivial diseñar una máquina de estados finitos para lograr esto, y por lo tanto debe existir una expresión regular, pero escribirla no es tan trivial, y ¡No me gustaría tener que depurarlo!
Sí ... pero es trivial en algunos sistemas numéricos. :-P –
quieres decir esto: '(((0 | 3 | 6 | 9) | ((1 | 4 | 7) (0 | 3 | 6 | 9) * (2 | 5 | 8))) | (((2 | 5 | 8) | ((1 | 4 | 7) (0 | 3 | 6 | 9) * (1 | 4 | 7))) ((0 | 3 | 6 | 9) | ((2 | 5 | 8) (0 | 3 | 6 | 9) * (1 | 4 | 7))) * ((1 | 4 | 7) | ((2 | 5 | 8) (0 | 3 | 6 | 9) * (2 | 5 | 8))))) * '? (Sí, hice un DFA y luego GNFA y luego regex: p) –
Utilice una implementación rápida cuando no tenga referencias. https://swtch.com/~rsc/regexp/regexp1.html – clemens
- Uso del grupo de no capturar
(?:pattern)
cuando es necesario repetir una agrupación, pero no es necesario utilizar el valor capturado que proviene de un grupo tradicional(capturing)
. - Utilice la atomic group (o subexpresión sin retroceso) cuando corresponda
(?>pattern)
. - Evite catastrophic backtracking como la peste mediante el diseño de sus expresiones regulares para terminar temprano para las coincidencias.
Creé un video que demostraba estas técnicas. Empecé con muy expresión regular mal escrito en el catastrophic backtracking artículo (x+x+)+y
. Y luego lo hice 3 millones de veces más rápido después de una serie de optimizaciones, evaluación comparativa después de cada cambio. El vídeo es específico de .NET pero muchas de estas cosas se aplican a la mayoría de los otros sabores de expresiones regulares, así:
- 1. Consejos y trucos de optimización
- 2. Hacks, sugerencias, trucos y mejores prácticas de Eclipse Ganymede
- 3. Sugerencias/trucos para limitar un script PHP
- 4. Accessor Método de optimización de rendimiento y
- 5. GWT FlexTable rendimiento y optimización
- 6. Sugerencias para mejorar el rendimiento de Eclipse
- 7. Representación en Flash: consejos y trucos para la optimización
- 8. trucos de rendimiento para C# Registro
- 9. Sugerencias sobre la optimización de EGit en Eclipse
- 10. Optimización del rendimiento de Lucene
- 11. Sugerencias y trucos para trabajar con las soluciones de Microsoft Visual Studio y el proyecto
- 12. iPhone optimización de rendimiento de openGLES
- 13. C++ Pautas de optimización de rendimiento/memoria
- 14. SOLR la optimización del rendimiento
- 15. Trucos para mejorar el rendimiento de desplazamiento de iPhone UITableView?
- 16. Optimización del rendimiento de inserción masiva ...?
- 17. Actualización masiva de registros - optimización del rendimiento
- 18. Regex lento rendimiento
- 19. SQL Server - Consejos y trucos de sinónimos?
- 20. trucos y consejos sobre la optimización de consultas [SQL Server 2005]
- 21. Consejos y trucos de WCF
- 22. Sugerencias y trucos para depurar Visual Studio (para proyectos C/C++)
- 23. Consejos y trucos profesionales
- 24. ¿Por qué esta optimización de Lua hack mejoraría el rendimiento?
- 25. Patrones de optimización del rendimiento de mapa de bits
- 26. Campo vs Propiedad. Optimización del rendimiento
- 27. Sugerencias máximas de rendimiento SHA-1 Hash en Java
- 28. ¿Cuáles son tus trucos favoritos de optimización de código de bajo nivel?
- 29. Consejos y trucos del emulador de Android
- 30. Trucos y consejos de entrenamiento Qt
me gustaría mencionar [Secuencia de Boole] (https://github.com/NaturalIntelligence/BooleanSequence) que actualmente admite menos símbolos de ER pero son rápidos, flexibles y están llenos de muchas funciones útiles. Puede escribir sus propios mezcladores para agregar más funciones o para hacerlas más rápidas. También realizan la optimización automática y puede ver cómo se evalúan utilizando gráficos basados en json o json. –