Quiero hacer algunas pruebas de cadena básicas en Node.js. Supongamos que tengo un formulario donde los usuarios ingresan su nombre y quiero verificar si solo es basura o un nombre real.RegEx con alfabeto latino extendido (ä ö ü ß)
Felizmente (o por desgracia para mi control) obtengo usuarios de todo el mundo, lo que significa que sus nombres contienen caracteres no ingleses, como ä ö ü ß é
. Solía usar /[A-Za-z -]{2,}/
pero esto no coincide con nombres como "Jan Buschtöns"
.
¿Tengo que agregar manualmente todos los posibles caracteres no ingleses pero latinos a mi RegEx para que funcionen? No quiero un RegEx de más de 100 caracteres como /[A-Za-z -äöüÄÖÜßéÉèÈêÊ...]{2,}/
.
Trucos como '/ \ w + /' no funcionan. Solo coinciden con los personajes ingleses. – buschtoens
¿Y qué pasa si obtienes a alguien con un nombre Salish? Los [idiomas Salish] (http://en.wikipedia.org/wiki/Salishan_languages) usan '7' como una letra, por ejemplo," Sḵwxwú7mesh "; y en una nota menos oscura, ¿qué hay de coreano, japonés, chino, ...? Quizás quiera leer [Los programadores de Falsehoods creen en los nombres] (http://www.kalzumeus.com/2010/06/17/falsehoods-programmers- creer-sobre-nombres /) también. Básicamente sugiero que no te molestes en absoluto con tu cuenta corriente. –
Ya pensé en los idiomas asiáticos y cirílicos. Tienen equivalentes latinos que pueden usar. Y ... Salish es un caso muy raro. : D – buschtoens