utf16 o utf32? Intento almacenar contenido en muchos idiomas. Algunos de los idiomas utilizan fuentes de doble ancho (por ejemplo, las fuentes japonesas con frecuencia tienen el doble de ancho que las fuentes en inglés). No estoy seguro de qué tipo de base de datos debería estar usando. Cualquier información sobre las diferencias entre estos cuatro conjuntos ...Utf8_general_ci o utf8mb4 o ...?
28
A
Respuesta
40
MySQL's utf32
y utf8mb4
(así como el estándar UTF-8) pueden almacenar directamente cualquier carácter especificado por Unicode; el primero tiene un tamaño fijo de 4 bytes por carácter, mientras que el segundo tiene entre 1 y 4 bytes por carácter.
utf8mb3
y el original utf8
sólo puede almacenar los primeros 65.536 puntos de código, que cubrirá CJVK (chino, japonés, Vietnam, Corea), y el uso de 1 a 3 bytes por carácter.
utf16
utiliza 2 bytes para los primeros 65.536 puntos de código y 4 bytes para todo lo demás.
En cuanto a las fuentes, eso es estrictamente visual.
Ver también MySQL documentation for Unicode support.
Cuestiones relacionadas
- 1. MySQL Colación: latin1_swedish_ci Vs utf8_general_ci
- 2. Convertir tablas y campos utf8_general_ci en utf8_unicode_ci
- 3. Hibernate o JPA o JDBC o?
- 4. Indy o ICS o?
- 5. O bien O validación requerida
- 6. addMouseListener o addActionListener o JButton?
- 7. Etiquetas o Buscar o Ambos
- 8. MVC o Rest o Ambos
- 9. if! Isset O condiciones O
- 10. Spring o CDI o EJB3
- 11. Java: ¿Un constructor o método que aceptará una matriz o conjunto o lista o ...?
- 12. Node.js: ¿Debería usar Vows o Expresso o NodeUnit o Zombie.js o All?
- 13. ¿Cuáles son las diferencias entre utf8_general_ci y utf8_unicode_ci?
- 14. submódulo o sub-repositorio Git o remoto?
- 15. "Marshall" o "Marshal"? "Marshalling" o "Marshaling"?
- 16. Javascript inicializan a indefinido o nulo o ""
- 17. O O restricciones no nulas en MySQL
- 18. clave principal SQL, INT o GUID o ...?
- 19. ¿Asegurar UDP - OpenSSL o GnuTls o ...?
- 20. PHP o HTML primero o ¿es importante?
- 21. GWT o DOJO o alguna otra cosa?
- 22. Anular copiar o copiarWithZone: ¿o ambos?
- 23. ¿Qué usar? MVC, MVP o MVVM o ...?
- 24. Falso o Ninguno vs. Ninguno o Falso
- 25. backbone o ext/sencha touch o ambos
- 26. "Iniciar sesión" o "Entrar" o "Login"
- 27. Condicional O O dos valores diferentes
- 28. O/R Mappers - Bueno o malo
- 29. Rieles: format.js o format.json, o ambos?
- 30. checkbox true o checked o yes
Para ser extra claro, el comentario sobre 'utf8_general' se aplica a todas las demás colaciones' utf8_ * 'también; todos usarán el juego de caracteres 'utf8mb3' aka' utf8' de MySQL. –
@JohnFlatness Gracias. Tu comentario es justo lo que iba a preguntar sobre el próximo. Aunque pensé que UTF-16 usaba 2 bytes para caracteres mandarín, por ejemplo. Estoy mirando la documentación que me diste, esperando que cubra lo que 65,536 significa. XD –
Los caracteres chinos se encuentran dentro del plano multilingüe básico (los primeros 65.536 puntos de código). –