¿Alguien puede decirme cuál es el rango de caracteres imprimibles Unicode? [p.ej. El rango de caracteres imprimibles de Ascii es \ u0020 - \ u007f]¿Cuál es el rango de caracteres imprimibles Unicode?
Respuesta
Sede, http://en.wikipedia.org/wiki/Unicode_control_characters
Es posible que desee ver especialmente en C0 y C1 carácter de control http://en.wikipedia.org/wiki/C0_and_C1_control_codes
El wiki dice, el carácter de control C0 está en el rango U + 0000-U + 001F y U + 007F (que es el mismo rango que ASCII) y el carácter de control C1 está en el rango U + 0080-U + 009F
que no sea el carácter de control C, Unicode también tiene cientos de caracteres de control de formato, por ejemplo sin anotación de ancho cero, lo que hace que el espaciado de caracteres sea más cercano, o control de texto bidireccional. Estos caracteres de control de formato están bastante dispersos.
Más importante aún, ¿qué estás haciendo que requiere que conozcas los caracteres no imprimibles de Unicode? Lo más probable es que lo que sea que intentes hacer sea el enfoque equivocado para resolver tu problema.
Quiero crear un generador de cadenas unicode al azar que genere caracteres imprimibles. –
¿Quién puede imprimir? ¿Quieres incluir, por ej. todos los caracteres chinos? Muchos usuarios no tendrán fuentes para ellos, por lo que 'imprimirlos' no les daría nada, una caja en blanco o algún otro personaje de reemplazo inútil. – bobince
Una buena razón es evitar exploits de seguridad: https://bugzilla.mozilla.org/show_bug.cgi?id=968576 –
Unicode, término estricto, no tiene rango. Los números pueden ir infinito.
Lo que ha dado no es UTF8 que tiene 1 byte para caracteres ASCII.
En cuanto al rango, creo que no hay un rango de caracteres imprimibles. Siempre evoluciona Mira la página que di más arriba.
Afaik Unicode solo se define hasta 0x10ffff, más allá de que no se asignarán puntos de código – Sebastian
Primero, debe eliminar la palabra 'UTF8' en su pregunta, no es pertinente (UTF8 es solo una de las codificaciones de Unicode, es algo ortogonal a su pregunta).
Segundo: el significado de "imprimible/no imprimible" es menos claro en Unicode. Quizás te refieres a un "graphical character"; y uno incluso puede disputar si un espacio es imprimible/gráfico. Los caracteres no gráficos consistirían, básicamente, en caracteres de control: el rango 0x00-0x0f más algunos otros que están dispersos.
De todos modos, la gran mayoría de los caracteres Unicode (más de 200,000) son "gráficos". Pero esto ciertamente no implica que sean imprimibles en su entorno.
Me parece una mala idea, si tiene la intención de generar una cadena Unicode "imprimible al azar", para intentar incluir todos los caracteres "imprimibles".
Lo que debe hacer es elegir una fuente y luego generar una lista de los caracteres Unicode que tienen glifos definidos para su fuente. Puede usar una biblioteca de fuentes como freetype para probar glifos (pruebe FT_Get_Char_Index (...)! = 0).
- 1. Resaltado y reemplazo de caracteres Unicode no imprimibles en Emacs
- 2. ¿Cómo puedo reemplazar caracteres Unicode no imprimibles en Java?
- 3. ¿Cómo especifico un rango de caracteres Unicode?
- 4. caracteres Unicode cadena
- 5. desprendimiento caracteres no imprimibles de una cadena en Python
- 6. Eliminar caracteres no imprimibles C# multilenguaje
- 7. Detectar caracteres no imprimibles en JavaScript
- 8. GpsSatellite.getSnr() - ¿Cuál es el rango de valores?
- 9. ¿Cuál es el punto de COLLATIONS para columnas nvarchar (Unicode)?
- 10. Python - Pyrersing caracteres Unicode
- 11. ¿Agregar caracteres no imprimibles a una cadena en Java?
- 12. Caracteres Unicode de Base64ing
- 13. ¿Cuál es el algoritmo estándar para convertir caracteres Unicode en minúsculas?
- 14. ¿Cómo puedo detectar caracteres no imprimibles en .NET?
- 15. ¿Cuál es el rango de ID de textura OpenGL?
- 16. ¿Cuál es la forma correcta de codificación URL de caracteres Unicode?
- 17. ¿Cómo reemplazo o encuentro caracteres no imprimibles en vim regex?
- 18. ¿Cómo iterar sobre caracteres Unicode en C++?
- 19. Lista de caracteres alfabéticos Unicode
- 20. ¿Cuál es el rango máximo de varchar en MySQL?
- 21. ¿Cuál es el rango de Random.nextDouble en Scala?
- 22. Caracteres Unicode del código de caracteres en javascript para los códigos de caracteres> 0xFFFF
- 23. ¿Cuál es el propósito de Unicode "Retroceso" U + 0008?
- 24. ¿Cuál es el punto de código Unicode para '¿'?
- 25. ¿Hay una lista de rango de codificación Unicode para los caracteres Emoji?
- 26. ¿Es posible imprimir texto o caracteres de Unicode en MATLAB?
- 27. iText, caracteres Unicode y Java
- 28. ¿Cuál es la categoría {L} Unicode?
- 29. Dibujando caracteres Unicode en iPhone
- 30. ¿Cuál es la actitud de Haskell hacia Unicode en XML?
\ u0000 - \ u0000 - \ u0020 tampoco se pueden imprimir en Unicode – Andrey
Más como \ u0020 - \ u007e –
Seguro que tiene mucho odio por esta pregunta. Me gusta la idea. – jsejcksn