2009-09-14 4 views
5

No tengo experiencia con el uso de C, y necesito usar PCRE para obtener coincidencias.
Aquí es una muestra de mi código fuente:¿Cómo puedo usar PCRE para obtener todos los grupos de coincidencias?

int test2() 
{ 
    const char *error; 
    int erroffset; 
    pcre *re; 
    int rc; 
    int i; 
    int ovector[OVECCOUNT]; 

    char *regex = "From:([^@]+)@([^\r]+)"; 
    char str[] = "From:[email protected]\r\n"\ 
        "From:[email protected]\r\n"\ 
        "From:[email protected]\r\n"; 

    re = pcre_compile (
      regex,  /* the pattern */ 
      0,     /* default options */ 
      &error,    /* for error message */ 
      &erroffset,   /* for error offset */ 
      0);     /* use default character tables */ 

    if (!re) { 
     printf("pcre_compile failed (offset: %d), %s\n", erroffset, error); 
     return -1; 
    } 

    rc = pcre_exec (
     re,     /* the compiled pattern */ 
     0,     /* no extra data - pattern was not studied */ 
     str,     /* the string to match */ 
     strlen(str),   /* the length of the string */ 
     0,     /* start at offset 0 in the subject */ 
     0,     /* default options */ 
     ovector,    /* output vector for substring information */ 
     OVECCOUNT);   /* number of elements in the output vector */ 

    if (rc < 0) { 
     switch (rc) { 
      case PCRE_ERROR_NOMATCH: 
       printf("String didn't match"); 
       break; 

      default: 
       printf("Error while matching: %d\n", rc); 
       break; 
     } 
     free(re); 
     return -1; 
    } 

    for (i = 0; i < rc; i++) { 
     printf("%2d: %.*s\n", i, ovector[2*i+1] - ovector[2*i], str + ovector[2*i]); 
    } 
} 

En esta demostración, la salida es única:

0: From:[email protected]
1: regular.expressions
2: example.com

Quiero salida de toda la partidos; ¿Cómo puedo hacer eso?

+0

No use una expresión regular sino un analizador real. El protocoal de correo electrónico permite más que la simple dirección del buzón. – Gumbo

+0

Esta es una demostración para pcre, solo quiero saber cómo usar pcre en grupos coincidentes. Gracias por su comentario. – tbmvp

+0

debe consultar esta publicación: http://stackoverflow.com/questions/7785557/pcre-match-all-groups-in-c – soulmachine

Respuesta

6

Utilizo una clase para ajustar PCRE para facilitar esto, pero después del pcre_exec, el superctor contiene los índices de subcadena que necesita para encontrar las coincidencias dentro de la cadena original.

por lo que sería algo así como:

#include <string> 
#include <iostream> 
#include "pcre.h" 

int main (int argc, char *argv[]) 
{ 
    const char *error; 
    int erroffset; 
    pcre *re; 
    int rc; 
    int i; 
    int ovector[100]; 

    char *regex = "From:([^@]+)@([^\r]+)"; 
    char str[] = "From:[email protected]\r\n"\ 
        "From:[email protected]\r\n"\ 
        "From:[email protected]\r\n"; 

    re = pcre_compile (regex,   /* the pattern */ 
         PCRE_MULTILINE, 
         &error,   /* for error message */ 
         &erroffset,  /* for error offset */ 
         0);    /* use default character tables */ 
    if (!re) 
    { 
     printf("pcre_compile failed (offset: %d), %s\n", erroffset, error); 
     return -1; 
    } 

    unsigned int offset = 0; 
    unsigned int len = strlen(str); 
    while (offset < len && (rc = pcre_exec(re, 0, str, len, offset, 0, ovector, sizeof(ovector))) >= 0) 
    { 
     for(int i = 0; i < rc; ++i) 
     { 
      printf("%2d: %.*s\n", i, ovector[2*i+1] - ovector[2*i], str + ovector[2*i]); 
     } 
     offset = ovector[1]; 
    } 
    return 1; 
} 
+0

Gracias por su respuesta. Pero todavía no sé cómo sacar todas las coincidencias. – tbmvp

+0

¿Obtiene el primer juego de matcheS? Tendrá que especificar la opción PCRE_MULTILINE cuando compile la expresión regular. Ver: http://www.pcre.org/pcre.txt para más detalles. Actualizaré el ejemplo. –

+0

He actualizado el código en mi respuesta para hacer lo que creo que necesita. No soy un experto en PCRE, ya que solo lo he usado a través de un contenedor, así que no estoy familiarizado con sus complejidades. Pensaría que habría una manera de hacer esto con 1 llamada al ejecutivo. y haz que devuelva la matriz ovector con índices de cadena a todas las coincidencias. Esto debería hacer el truco sin embargo. –

5

nota: último parámetro de pcre_exec() debe ser elemento de cargos, no sizeof()! (http://www.pcre.org/readme.txt)

+1

Además: el recuento de elementos debe ser un múltiplo de 3 (por ejemplo, 90 no 100!) – glob

+0

http://regexkit.sourceforge.net/Documentation/pcre/pcre_exec.html – glob

Cuestiones relacionadas