Esto depende en gran medida del idioma (y del motor de expresiones regulares) que esté utilizando.
En Perl, \w
coincide con todos los caracteres de palabras, independientemente del idioma o el alfabeto, y algo así como /\b(\w+)\b/
podría (probablemente) coincidir con palabras españolas, así como palabras en inglés o en ruso.
En los idiomas que utilizan PCRE, \w
(y por lo tanto probablemente \b
) NO coinciden con los caracteres Unicode. Probablemente necesites construir tu propio conjunto. Sugiero algo como [\wáéíóúñ]
(coincide con todos los caracteres de las palabras, más los caracteres acentuados que desee), y la biblioteca PCRE debe preconstruirse con soporte Unicode antes de que esto funcione.
Si está usando algo más, buena suerte. Algunos motores de expresiones regulares ni siquiera admiten Unicode.