Bueno, la verdad es: UTF-24 se sugirió en 2007:
http://unicode.org/mail-arch/unicode-ml/y2007-m01/0057.html
Los mencionados pros & contras de ser:
"UTF-24
Advantages:
1. Fixed length code units.
2. Encoding format is easily detectable for any content, even if mislabeled.
3. Byte order can be reliably detected without the use of BOM, even for single-code-unit data.
4. If octets are dropped/inserted, decoder can resync at next valid code unit.
5. Practical for both internal processing and storage/interchange.
6. Conversion to code point scalar values is more trivial then for UTF-16 surrogate pairs
and UTF-7/8 multibyte sequences.
7. 7-bit transparent version can be easily derived.
8. Most compact for texts in archaic scripts.
Disadvantages:
1. Takes more space then UTF-8/16, except for texts in archaic scripts.
2. Comparing to UTF-32, extra bitwise operations required to convert to code point scalar values.
3. Incompatible with many legacy text-processing tools and protocols. "
Como ha señalado David Starner en http://www.mail-archive.com/[email protected]/msg16011.html:
¿Por qué? UTF-24 casi invariablemente será más grande que UTF-16, a menos que esté hablando un documento en Old Italic o Gothic. Los caracteres matemáticos alfanuméricos casi siempre se combinarán con suficiente ASCII para hacer que UTF-8 sea una victoria, y si no, suficientes caracteres BMP para hacer que UTF-16 sea una victoria. Las computadoras modernas no manejan bien los trozos de 24 bits; en memoria, tendrían ocupando 32 bits por pieza, a menos que los declarara empaquetados, y luego serían mucho más lentos que UTF-16 o UTF-32. Y si está almacenando en el disco , también puede usar BOCU o SCSU (ya está yendo no estándar), o usar compresión estándar con UTF-8, UTF-16, BOCU o SCSU. SCSU o BOCU comprimido debería ocupar la mitad del espacio de UTF-24, si eso.
También puede comprobar el siguiente post StackOverflow:
Why UTF-32 exists whereas only 21 bits are necessary to encode every character?
La simple razón es porque no hay una estructura 24. Hay 16, 32, 8, 2, así que 24 serían extraños. Además, los bloques de memoria normalmente se distribuyen en bloques de 2^x ... Es la misma razón por la que el cómputo no viene con 24 MB o los HDD no se anuncian con 24 GB en lugar de 16 GB y 32 GB. –