2012-03-18 9 views
6

Sé que Windows ha admitido planos suplementarios desde Windows XP.En Windows, ¿cómo se ingresa un carácter fuera del plano multilingüe básico Unicode?

Tengo fuentes que sé que tienen caracteres fuera del plano multilingüe básico (BMP).

Para estos caracteres, el punto de código Unicode consta de cinco dígitos hexadecimales.

No sé cómo ingresar estos caracteres en las aplicaciones.

Windows parece que solo admite el ingreso de caracteres por el teclado en el BMP. Puede ingresar un número decimal o algunas aplicaciones le permiten ingresar un número hexadecimal de cuatro dígitos.

¿Alguien puede confirmar cómo se gestiona la entrada? No me importa si es directamente desde el teclado o asistido por la aplicación. (La aplicación predeterminada "Mapa de caracteres" de Windows solo admite caracteres en el BMP, por lo que necesito sugerencias, preferiblemente a una aplicación compatible con al menos Unicode Versión 5, si no 6.)

En Java, estos caracteres se administran usando "pares de sustitución" en UTF-16. Me preocupa que Windows también pueda tener algo del viejo legado "Unicode es 16 bit", lo que causa un problema similar. Incluso obtener la confirmación de que necesito perforar los números de los pares sustituidos sería una respuesta.

Gracias!

Respuesta

3

Ok, claramente no sé de qué estás hablando.

De todos modos, refiriéndose a:

El defecto de Windows "Mapa de caracteres" aplicación sólo es compatible personajes de la BMP, así que necesito sugerencias - preferentemente a una aplicación compatible con Unicode, al menos, la versión 5, si no 6

He encontrado un enlace a una aplicación que podría ayudar.

http://www.babelstone.co.uk/software/babelpad.html

descargarlo y seleccione el menú Herramientas -> luego de caracteres.

Espero que ayude.

Si no lo siento por el malentendido, solo tengo la intención de ayudar.

+0

Parece que http://www.babelstone.co.uk/Software/BabelMap.html es explícitamente una aplicación de mapas de caracteres que actualmente admite Unicode 6.0. Eso debería funcionar. – yam655

+0

Todavía va fuerte y ahora cubre Unicode 10.0 ... – SlySven

1

Al menos en MS Word 2007, el método Alt + X también funciona para caracteres que no sean BMP: ingrese U + seguido del número Unicode en hexadecimal, luego Alt + X. Los caracteres U + pueden omitirse si el carácter anterior no es un dígito o una letra A-F o X. Es posible que deba seleccionar explícitamente la fuente del texto (es decir, Word no cambia necesariamente a una fuente que contiene el carácter, como lo hace normalmente con los caracteres BMP).

En Word, puede usar alternativamente el comando Insertar → Símbolo y luego, en la ventana de inserción, seleccionar una fuente que contenga el carácter que necesita.

Usando el programa UnicodeInput, puede ingresar un carácter presionando Alt ++ y luego ingresando el número Unicode. También es compatible con BMP, pero con una restricción extraña, debido a un error del programa: no funciona para caracteres que no sean BMP si el cuarto dígito de la derecha es una letra (por ejemplo, U + 1B000).

BabelPad, mencionado en la respuesta de Martin, es una gran alternativa y le permite seleccionar caracteres tanto por número como por nombre Unicode.

Probablemente haya otros editores Unicode que le permitan trabajar con BMP; echa un vistazo a la lista de Alan Wood de Unicode and Multilingual Programs and Utilities.

+0

Es extraño. Los planos de suministros han existido desde Unicode 2.0 (donde estaban reservados, pero no utilizados). La lista de Alan Wood no menciona si una aplicación admite caracteres fuera del BMP y sé de hecho que algunas de las aplicaciones mencionadas están limitadas al BMP. - Es útil sobre la cosa Alt-X. No sabía que admitía personajes fuera del BMP. – yam655

2

Ahora he compuesto una pequeña utilidad que se puede utilizar en un navegador web de una manera similar a la aplicación: Full Unicode Input utility. Es similar al Mapa de caracteres en Windows, pero le permite acceder a todos los planos Unicode y obtener los caracteres seleccionados recopilados en un área, desde donde se pueden copiar como una unidad. Algo rápido y sucio, pero funcional.

+0

Parece bastante ordenado, pero ... ¿En qué versión de Unicode se basa? Por ejemplo, si vas a "CJK Unified Ideographs Extension B", veo un montón de personajes en esa sección, pero el único que se muestra en esa sección es simplemente "primero" y los demás aparecen como "sin asignar". Parece que la base de datos Unicode que se usa es antigua. – yam655

+0

@ yam655, está basado en la versión 6.2 (la más nueva). Hubo un error al manejar los puntos de código definidos (en la base de datos de caracteres) como rangos, con solo el primer y el último punto teniendo sus entradas. Esto afectó a la información que se muestra sobre un punto de código en el mouseover y el color de la celda, no la funcionalidad. Ahora he hecho una solución rápida y sucia a esto. –

1

Voy a descaradamente conectar una pequeña herramienta que escribí para ingresar símbolos en Windows, ya que encuentro que cualquier solución suele ser demasiado engorrosa para el uso frecuente diario. Mi caso de uso personal es escribir el sueco, por ejemplo, en un teclado internacional de EE. UU. Sin tener que cambiar de diseño.

Permite la entrada de caracteres Unicode a través de una ventana emergente no muy diferente a la forma en que esto funciona en Apple OS X.

Ver https://github.com/mjvh80/SymWin para los detalles, que es gratuito y de código abierto, pero debe (actualmente) ser compilado. Si hay interés suficiente, podría agregar una versión preconstruida.

La herramienta se puede configurar por clave, p. Ej. copiando/pegando símbolos una vez desde un sitio como http://copypastecharacter.com.

Cuestiones relacionadas