2012-01-16 23 views
13

Tengo algunos caracteres UTF-8 archivos creados en Mac, y al intentar abrirlos usando TextPad en Windows, aparece el siguiente aviso:TextPad y Unicode: ¿soporte completo?

ADVERTENCIA: (nombre de archivo) contiene caracteres que no existen en el código página 1252 (ANSI Latin 1). Se convertirán al carácter predeterminado del sistema , si hace clic en Aceptar.

Linux (GNOME gEdit) puede abrir el mismo archivo sin quejas. ¿Qué significa lo anterior? Pensé que TextPad tenía soporte completo UTF-8. ¿Puedo abrir y editar archivos UTF-8 con seguridad sin dañar el archivo?

+2

Lamentablemente, la versión reciente (marzo de 2013) de TextPad v7 no soluciona este problema. –

+0

Siempre tuve el mismo problema, también. TextPad es increíble, pero apesta cuando se trata de codificación de caracteres. Lo que hago para eludir el problema es poner todas las líneas de definición de íconos de mis archivos css en un archivo css separado. Luego edito este archivo con el Bloc de notas. – reggie

+2

TextPad 8 está aquí con soporte BMP Unicode (vea http://stackoverflow.com/a/35076216/8946) –

Respuesta

10

Parece que TextPad no puede manejar caracteres fuera de windows-1252 (CP1252, aquí lleva el nombre incorrecto "ANSI Latin 1"). Lo probé en Windows, abriendo un archivo de texto plano creado en el mismo sistema, como UTF-8 codificado, con y sin lista de materiales, con el mismo resultado. La ayuda del programa no parece contener nada relacionado con las codificaciones de caracteres, y sus herramientas para escribir "caracteres internacionales" son solo para caracteres latinos-1.

Existen varios editores de texto para Windows que pueden tratar con UTF-8 (incluso el Bloc de notas puede abrir un archivo UTF-8, pero apenas se recomienda para una edición seria). Consulte la colección de información de Alan Wood en Unicode editors and word processors for Windows. (Personalmente, me gustan los Notepad ++ y BabelPad, que son ambos gratuitos.)

+0

La especificación para TextPad dice específicamente esto: "archivos de texto Unicode, UTF-8 y 8 bits de 16 bits con los caracteres de un solo byte y doble pueden editarse ". –

+3

La Ayuda de TextPad dice algo confuso acerca de las codificaciones, pero configurar Encoding to UTF-8 en el diálogo Abrir no ayuda. Tampoco ayuda configurar, en Configurar/Preferencias, la codificación predeterminada para UTF-8: los datos aún se aplanan en windows-1252 (es decir, los caracteres externos se asignan a Windows-1252 caracteres o signos de interrogación o algo más). Dicen "Esto significa que solo es posible editar, sin pérdida de datos, los archivos que contienen caracteres de la página de códigos implícita." (Ayuda de TextPad, palabra clave "unicode") –

+0

Muy extraño. ¡No puedo entender el pago de un producto como ese cuando Notepad ++ existe! –

6

TextPad 'admite' documentos UTF-8 y UTF-16 solo en la medida en que los importará y exportará. Pero todavía edita los archivos como bytes simples, y no como caracteres Unicode (usando la página de códigos ANSI, que es la página de códigos 1252 para Europa Occidental).

De modo que a menos que el archivo contenga solo caracteres que también existen en esa página de códigos, perderá contenido. Esto más bien derrota el punto de Unicode.

De hecho, este fue el problema que me hizo huir a EmEditor, en ese momento, aunque ahora estaría de acuerdo con los comentarios anteriores y recomendaría Notepad ++. La era de pagar por editores de texto se ha ido hace tiempo.

+1

Si solo puedo decir una cosa más en stackoverflow por el resto de mi vida, entonces sería probar emeditor. Magnífico. – monkjack

+0

A partir de TextPad 8 esto ya no es correcto. –

3

me encontré con una discusión sobre este tema en los foros Textpad: http://forums.textpad.com/viewtopic.php?t=11019

Aunque no tengo Notepad ++, Textpad maneja archivos de gran tamaño con facilidad, mientras que otros editores que he probado, incluyendo Notepad ++, ya sea a paso de tortuga o morir . Actualmente estoy tratando de editar un archivo de 475 MB y Notepad ++ no está a la altura de la tarea.

+0

Archivos grandes: creo que se debe al texto resaltado, que necesita mucha más memoria. Notepad ++ no puede arreglar esto porque esta es una limitación del componente Scintilla que Notepad ++ usa para mostrar el texto. – StanE

+0

[EmEditor está diseñado específicamente para manejar archivos de gran tamaño con gracia] (https://www.emeditor.com/text-editor-features/large-file-support/large-file-controller/). En mi experiencia (por ejemplo, con archivos SQL de 5-15 GB de tamaño en una computadora Windows de 64 bits con 4 GB de RAM), lo hace admirablemente. (Ciertas operaciones como búsqueda y reemplazo globales siempre serán lentas en cualquier editor de texto en esta situación, pero EmEditor tiene un enfoque práctico para hacer lo posible.) –

-2

Prueba el código ANSI conjunto con Archivo/Abrir, que debe resolver el problema de Textpad

5

En realidad Textpad no soporta el mostrado puntos de código Unicode concedió que se dedicaban a la manera equivocada. Para mostrar los caracteres Unicode, debe seleccionar Configurar-> Preferencias y expandir "Clases de documento-> Texto-> Fuente.

Debe elegir una fuente Unicode Y establecer la secuencia de comandos para que coincida. Por ejemplo, Arial Unicode MS con script CHINESE_BIG5.

Sin embargo, este es un enfoque retrógrado ya que la aplicación debe manejar esto cuando el usuario le dice a TextPad que abra el archivo en Unicode o UTF-8. La aplicación de Bloc de notas integrada con MS Windows detectará la codificación automáticamente y mostrar los glifos correctamente en función de la codificación.

+1

Incluso Arial Unicode MS no contiene todos los glifos que querer; y si yo, un cliente que paga y un graduado en ciencias de la computación, no podría de ninguna manera averiguar cómo crear un archivo de código fuente UTF-8 multilingüe (incluso solo paneuropeo) con TextPad, después de leer sus archivos de ayuda, foros, etc. y después de intentar contactar al soporte; entonces hay algo muy mal (¡no debería decir cuánto tiempo perdí luchando con volcados de SQL UTF-8 corruptos debido a TP!) Si las personas de TextPad van a reclamar compatibilidad Unicode para su producto, al menos deberían poner un asterisco al lado de ese reclamo! –

6

Textpad 8, la más reciente a partir del 01.28.2016, hace finalmente soportar adecuadamente BMP Unicode. Es una actualización pagada, pero hasta ahora ha funcionado perfectamente para mí.

+0

Sí, pero ...incluso la clase txt está configurada para convertir siempre a utf8, el comando de archivo devuelve utf8, el bloc de notas ++ abre correctamente el archivo, se selecciona la fuente unicode para la clase txt, convierte el ä y el ö en caracteres rotos al asumir ANSI, pero si uno inserta no -ansi códigos de página de códigos como caracteres cirílicos de lo que asume correctamente utf8. Para mí, esto es un error, no una característica y sí, los controladores NotePad ++ están correctos –