En JavaScript:UTF-8 palabra expresiones regulares límite en javascript
"ab abc cab ab ab".replace(/\bab\b/g, "AB");
me da correctamente:
"AB abc cab AB AB"
Cuando uso caracteres UTF-8 sin embargo:
"αβ αβγ γαβ αβ αβ".replace(/\bαβ\b/g, "AB");
la word boundary operator no parece funcionar:
"αβ αβγ γαβ αβ αβ"
¿Hay una solución a esto?
JavaScript no utiliza 'UTF-8' para Unicode. Según el estándar, una implementación puede usar 'UCS-2' o' UTF-16', creo. Esto significa que está operando en texto que se ha convertido a uno de estos formatos, o podría estar operando en un texto donde cada "octeto" (byte) de cada punto de código Unicode se ha convertido a uno de estos formatos, dependiendo de cómo se el código recibe el texto. – hippietrail