Parece que algunos caracteres del idioma europeo no se pueden almacenar en UTF-8?
No es cierto. UTF-8 puede almacenar cualquier conjunto de caracteres sin limitaciones, excepto tal vez para Klingon. UTF-8 es su ventanilla única para la internacionalización. Si tiene problemas con los caracteres, es muy probable que estén codificando problemas, o falta soporte para ese rango de caracteres en la fuente que está usando para mostrar los datos (sin embargo, es extremadamente improbable para un personaje de idioma europeo, pero es común cuando se ve sitios indios en una computadora europea. Consulte también this question)
Si no se puede representar un juego de caracteres no occidental, es posible que la fuente incorporada del usuario no tenga ese rango de UTF-8 cubierto.
Actualización: Klingon es de hecho no es parte de official UTF-8:
Algunos modernos guiones inventados que aún no se han incluido en Unicode (por ejemplo, Tengwar) o que no reúnen los requisitos para su inclusión en Unicode debido a la falta de uso en el mundo real (por ejemplo, Klingon) se enumeran en el Registro Unicode de ConScript, junto con las asignaciones de códigos de área de uso privado no oficiales pero ampliamente utilizadas.
Sin embargo, hay una volunteer project que se ha asignado inofficially puntos de código F8D0-F8FF en la zona privada a Klingon. Gallery of Klingon characters
UTF-8 es un esquema de codificación para Unicode. Todos los caracteres Unicode se pueden escribir en UTF-8. "Es capaz de representar cualquier personaje en el estándar Unicode" http://en.wikipedia.org/wiki/UTF-8. ¿Que estas preguntando? Si UTF-8 codifica todos los caracteres Unicode? –
tengo curiosidad ... ¿qué caracteres de lenguaje europeo sería eso? – hop