2010-04-06 8 views
6

he traducido un documento del Inglés al Noruego en el formato de látex, y durante el uso de caracteres especiales noruegas, me sale un error al usarNo hay caracteres noruegos en LaTeX

\usepackage[utf8x]{inputenc} 

para tratar de mostrar el noruego (escandinavo) caracteres especiales en formato/PDF/DVI PostScript, diciendo

Package utf8x Error: MalformedUTF-8sequence. 

Así, mientras que no funcionó, probé otra posible solución:

\usepackage{ucs} 
\usepackage[norsk]babel 

Y cuando trataba de salvar lo que en Emacs me sale este mensaje:

These default coding systems were tried to encode text 
in the buffer `lol.tex': 
(utf-8-unix (905 . 4194277) (916 . 4194245) (945 . 4194278) (950 
. 4194277) (954 . 4194296) (990 . 4194277) (1010 . 4194277) (1013 
. 4194278) (1051 . 4194277) (1078 . 4194296) (1105 . 4194296)) 
However, each of them encountered characters it couldn't encode: 
utf-8-unix cannot encode these: \345 \305 \346 \345 \370 \345 \345 \346 \345 \370 ... 

Gracias a Emacs que tienen la posibilidad de revisar las propiedades de esos personajes y el primero me dice:

character: \345 (4194277, #o17777745, #x3fffe5) 
preferred charset: eight-bit (Raw bytes 128-255) 
code point: 0xE5 
syntax: w which means: word 
buffer code: #xE5 
file code: not encodable by coding system utf-8-unix 
display: not encodable for terminal 

Lo que no me dice mucho. Cuando trato de compilar esto con texi2dvi --dvipdf filename.text obtengo un PDF perfectamente fino, todo ello sin los caracteres especiales noruegos.

Cuando estoy a punto de guardar Emacs también me preguntan: "Seleccione el sistema de codificación (texto sin procesar por defecto):" Y escribo utf-8 para elegir su sistema de codificación. También he intentado elegir el texto sin procesar predeterminado para ver si obtengo un resultado diferente. Pero nada.

Por fin me trataron \ lstset {InputEncoding = utf8x, extendedchars = \ true} ... un código que se acercó al tratar de google la solución a este problema. Lo cual me da este error: Secuencia de control no definida.

Básicamente, he intentado todas las opciones de codificación que he podido encontrar y nada funciona. Estoy tratando desesperadamente de hacer que esto funcione, ya que la traducción noruega debe publicarse antes de la fecha límite.

Como información adicional puedo agregar que descubrí más tarde que solo tenía el en_US.UTF-8 en mi localidad, así que agregué nb_NO.UTF-8 y nb_NO.ISO-8859-15 y ejecuté la configuración regional -gen + reiniciar sin ningún cambio.

Espero haber proporcionado suficiente información para obtener ayuda, los personajes en cuestión son æ ø å.

+1

El hecho de que el archivo se llama 'lol.tex' me hace sonreír. –

+0

Realmente se llama what-is-fs.tex pero hice un --recode en eso, así que necesitaba una nueva copia y mi imaginación no generó ninguna otra buena sugerencia. – bleakgadfly

Respuesta

4

Aparentemente su emacs está teniendo dificultades para guardar el archivo como UTF-8 (lo cual no tiene mucho sentido ya que debería poder representar todos los caracteres que usan esa codificación). Debería intentar usar otro editor con soporte de codificación múltiple para guardar el archivo como UTF-8.

Si bien no puede guardar el archivo en UTF-8, LaTeX no podrá leerlo correctamente, a menos que especifique su codificación de archivo actual como inputenc parámetro del paquete. Puede intentar, por ejemplo, guardar el archivo como está en emacs pero especificando \usepackage[latin1]{inputenc} que debería funcionar si emacs está escribiendo el archivo usando algo de la familia * iso-8859 - **.

+0

¡Impresionante! No puedo creer que todo fuera Emacs. Acabo de copiar todo el archivo en gedit y funcionó de maravilla. Me pregunto cuál fue el problema con Emacs, realmente malo. ¡Gracias, de todos modos! – bleakgadfly

+0

obtengo errores similares en emacs sobre char. codificación al pegar desde documentos que tienen diferentes codificaciones. – Mica

4

He resuelto este error estableciendo el sistema de codificación para el archivo ahorro:

C-x C-m f utf-8-unix 
+0

Yo también. Usé utf-8 como la codificación de entrada de archivo. –