Unicode especifica que \X
should match an "extened grapheme cluster" - por ejemplo, un carácter base seguido de cero o más caracteres de combinación. (Creo que esto es una simplificación, pero puede ser suficiente para mis necesidades.)¿Vim tiene un equivalente a X para coincidir con los "clústeres de grafemas" de Unicode?
Estoy bastante seguro de que al menos Perl admite \X
en sus expresiones regulares.
Pero Vim define \X
para que coincida con un dígito hexadecimal no.
¿Vim tiene un equivalente a \X
o de cualquier forma que coincida con un clúster de grafemas extendido Unicode?
Vim tiene un concepto de combinar o "componer" caracteres, pero its documentation no cubre si son compatibles o no en expresiones regulares.
Parece que Vim aún no soporta esto directamente, pero todavía estoy interesado en una solución donde una búsqueda resaltará todos los caracteres que incluyen una combinación de caracteres en al menos la gama más básica de U+0300
a U+0364
.
¿Qué es exactamente lo que quieres hacer? ¿Podría proporcionar un caso de muestra? ¿Quieres unir esos "caracteres" como à o Æ? – romainl
Voy a escribir algunos códigos JavaScript para convertir entre caracteres en georgiano y varios esquemas de transliteración oficiales y ad-hoc. Algunos de estos caracteres pueden implicar la combinación de caracteres, por lo que quiero asegurarme de que mis herramientas sean capaces de trabajar con ellos, incluso decirme qué texto encuentro en la naturaleza y pegarlo contiene esos caracteres. – hippietrail
Por ejemplo, podría necesitar manejar 'J̌' (' 004a 030c'). Pero, en términos más generales, solo quiero saber si Vim tiene o planea tener soporte para esto, ya que cada vez es más común que los programadores estadounidenses tengamos que lidiar con tales cosas. – hippietrail