Quiero deshabilitar cierta entrada UTF-8 (del lado del servidor), p. idiomas orientales, donde la entrada de ejemplo podría ser "伊".¿Cómo puedo detectar caracteres no occidentales?
Sin embargo, sí quiero continuar apoyando otros caracteres latinos o "latinos", como el galés ŵ y ŷ, por lo que checking against latin-1 is not possible.
¿Cuáles son mis opciones? (si es específico del idioma, se prefiere PHP)
Muchas gracias.
Razonamiento: soporte del navegador para una gran cantidad de caracteres no occidentales a menudo está ausente (por ejemplo en un navegador diferente acabo de ver una caja en la pregunta anterior), por lo que para cosas como los nombres de visualización a veces es conveniente restringir incluso si no es apropiado para los cuerpos de mensajes
¿Le importa si le pregunto por qué no quiere permitir que algunos lenguajes en un sitio de internacionalización? – Borealid
Pregunta justa. Es solo necesario para un campo de una tabla; el resto del sitio web lo apoyará. – HoboBen
Entonces, ¿cuál es el subconjunto de caracteres que está permitiendo? ¿Se ajusta a un juego de caracteres existente? Si es así, simplemente puede 'iconv' la cadena a la codificación de destino, descartando todos los caracteres no válidos. – deceze