¿Hay un motor de búsqueda que me permita buscar por una expresión regular?motor de búsqueda de expresiones regulares
Respuesta
Google Code Search le permite buscar utilizando una expresión regular.
Por lo que yo sé, no existe ese motor de búsqueda para búsquedas generales.
Tenga en cuenta que Google Code Search se está retirando. – MetaEd
La mayoría de las respuestas a esta pregunta ahora están desactualizadas. [Google Web Search también admite expresiones regulares] (http://webapps.stackexchange.com/a/82769/20087) ahora. –
Hay algunos problemas con las expresiones regulares que actualmente prohíben el empleo de estos en escenarios del mundo real. Lo más apremiante sería que todo el Internet en caché tendría que coincidir con su expresión regular, lo que requeriría importantes recursos informáticos; los índices son bastante inútiles en el contexto regex, debido a que las expresiones regulares son potencialmente independientes (/ fo * bar /).
No tengo un motor específico para sugerir.
Sin embargo, si pudiera vivir con un subconjunto de la sintaxis de expresiones regulares, un motor de búsqueda podría almacenar tokens adicionales para hacer coincidir de manera eficiente expresiones bastante complejas. Solr/Lucene permite tokenización personalizada, donde la misma palabra puede generar múltiples tokens y con varios conjuntos de reglas.
Usaré mi nombre como ejemplo: "Mark marca el lugar".
Caso insensible con derivados: (marca, marca, spot)
Caso sensible sin derivada: (Marcos, marcas, spot)
Caso sensible con la expansión NLP tesauro: ([Marcos, Marc] , [marcar, indicar, a punto], [punto, posición, ubicación, baliza, coordenada])
Y ahora evoluciona hacia su pregunta, no distingue entre mayúsculas y minúsculas, derivación, dedupe, autocompletar el prefijo que coincide: ([m, ma , mar, marca], [s, sp, spo, spot])
Y si quisieras emparejar el estilo "substring" sería: ([m, ma, mar, marca, a, ar, arca, r, rk, k], [s, sp, spo, spot, p, po, pot] , o, ot, t])
Un solo índice de búsqueda contiene todas estas formas diferentes de tokens y elige cuáles usar para cada tipo de búsqueda.
Probemos la palabra "Missippi" con un estilo de expresiones regulares con los símbolos literales: [m, m ?, m +, i, i ?, i +, s, ss, s +, SS + ...] etc.
Las reglas reales dependerán del subconjunto de expresiones regulares, pero es de esperar que el patrón sea cada vez más claro. Se extendería aún más para unir otros fragmentos de expresiones regulares, y luego usaría una forma de buscar frases para encontrar coincidencias.
Por supuesto, el índice sería bastante grande, PERO podría valer la pena, dependiendo de los requisitos del proyecto. Y también necesitaría un analizador de consultas y lógica de aplicación.
Me doy cuenta de que si buscas un motor enlatado esto no funciona, pero en términos teóricos, así es como me acercaría (¡suponiendo que sea realmente un requisito!). Si todo el mundo deseara una coincidencia de subcadenas y una coincidencia de comodines flexible, podría salirse con muchos tokens en el índice.
En términos de aplicaciones enlatadas, puede ver OpenGrok, utilizado para la indexación de código fuente, que no es de tamaño completo, pero entiende bastante bien el código fuente.
Un artículo muy bueno en la búsqueda de expresiones regulares en un índice de trigrama por Russ Cox
http://www.google.com/codesearch se ha cerrado ...
búsqueda de expresiones regulares toma muchos recursos y por lo tanto no es affordale por los motores de búsqueda populares.
Globalogiq tiene un HTML Source Code Search donde puede buscar con expresiones regulares. Sin embargo, no es gratis.
Si regex consume demasiados recursos, ¿por qué no cobrar por su uso por cputime en lugar de hacerlo completamente inasequible? Estoy seguro de que algunas personas pagarían y se aprovecharían de él (y por supuesto ofrecerían una explicación del cargo, explicar en términos de huella de carbono y recursos de la CPU). Google admite expansivo * en sus búsquedas *go
o go*
o intitle: "*go"
aquí está: http://www.hackcollege.com/blog/2011/11/23/infographic-get-more-out-of-google.html
- 1. expresiones regulares de búsqueda hacia delante opcional
- 2. búsqueda de Ruby matrices con expresiones regulares Las expresiones
- 3. búsqueda hacia delante expresiones regulares opcional
- 4. Las expresiones regulares búsqueda negativa hacia delante
- 5. Construyendo un motor de expresiones regulares - recursos en línea?
- 6. El uso de expresiones regulares de búsqueda hacia delante, egrep
- 7. Búsqueda de hash/diccionario/mapa con expresiones regulares
- 8. expresiones regulares (GREP) para la búsqueda de varias líneas necesitaba
- 9. Expresiones regulares en J2ME
- 10. Escapar cadena de expresiones regulares en Python
- 11. Compilador de expresiones regulares
- 12. Limitaciones de expresiones regulares?
- 13. ¿Composición de expresiones regulares?
- 14. de expresiones regulares negativo
- 15. expresiones regulares (expresiones regulares), reemplace la segunda aparición en javascript
- 16. Motor de búsqueda ASP.NET
- 17. Peor análisis de casos para expresiones regulares
- 18. Servidor SQL y expresiones regulares
- 19. Multiplicación con expresiones regulares .NET
- 20. Número de coincidencias de expresiones regulares
- 21. ¿Cómo mayúsculas un patrón de expresiones regulares?
- 22. Partido hasta x expresiones regulares o y expresiones regulares
- 23. expresiones regulares en Javascript con jQuery Contiene expresiones regulares extensión
- 24. ¿Por qué las expresiones regulares se llaman expresiones "regulares"?
- 25. Intersección de dos expresiones regulares
- 26. ExpressJS ruta de expresiones regulares
- 27. depuración de Perl expresiones regulares
- 28. Analizador de expresiones regulares ligero
- 29. Significado de (?) En expresiones regulares
- 30. Expresiones regulares de SQL Server
Sin embargo, las clases de caracteres podrían ser factibles. –
Esto sería bueno, pero las búsquedas de expresiones regulares no permiten una indexación eficiente y daría como resultado una búsqueda lineal de un billón de páginas en Internet. Sin embargo, es posible que haya categorías más pequeñas, como artículos en un sitio web en particular o publicaciones en StackOverflow. – Vortico
[stackse] (http://stackse.com/) – ren