Quizás esta no sea la respuesta que necesitabas, pero encontré un problema similar, así que decidí ponerlo aquí.
Necesitaba convertir 500 archivos xml a UTF8 a través de Notepad ++. ¿Por qué Notepad ++? Cuando utilicé la opción "Codificar en UTF8" (muchos otros convertidores usan la misma lógica) dañó todos los caracteres especiales, así que tuve que usar "Convertir a UTF8" explícitamente.
Aquí algunos sencillos pasos para convertir varios archivos a través de Notepad ++ sin estropear con caracteres especiales (por ej. Los signos diacríticos).
- Run Notepad ++ y luego abrir menú Plugins-> Plugin Manager-> Mostrar administrador de complementos
- Instalar Python script. Cuando se instala el complemento, reinicie la aplicación .
- Elija el menú Complementos-> Python Script-> Nueva secuencia de comandos.
- Elija su nombre, y luego pasado el código siguiente:
convertToUTF8.py
import os
import sys
from Npp import notepad # import it first!
filePathSrc="C:\\Users\\" # Path to the folder with files to convert
for root, dirs, files in os.walk(filePathSrc):
for fn in files:
if fn[-4:] == '.xml': # Specify type of the files
notepad.open(root + "\\" + fn)
notepad.runMenuCommand("Encoding", "Convert to UTF-8")
# notepad.save()
# if you try to save/replace the file, an annoying confirmation window would popup.
notepad.saveAs("{}{}".format(fn[:-4], '_utf8.xml'))
notepad.close()
A fin de cuentas, ejecute el script
Puedes usar la herramienta que escribí para que , También sufrí el mismo problema e hice mi propia salida. https://github.com/srcnalt/ANSI-to-UTF8 – Sarge