2011-08-06 32 views
9

Tengo un documento de Excel con una tabla de datos que contiene caracteres chinos. Estoy intentando exportar esta hoja de cálculo de Excel a un archivo CSV para importarla a una base de datos MySQL.¿Cómo exporto un archivo de Excel con caracteres chinos a un archivo CSV?

Sin embargo, cuando guardo el documento de Excel como un archivo CSV, el Bloc de notas muestra los caracteres chinos del archivo CSV resultante como signos de interrogación. La importación a MySQL conserva los signos de interrogación, ignorando por completo cuáles son los caracteres chinos originales.

Sospecho que esto puede tener que ver con el uso de Excel con codificación UTF-8. ¡Gracias por tu ayuda!

+0

Bloc de notas es ficticio. ¿Intentó abrirlo con un editor de texto real? como Notepad ++ o Ultraeditor. –

+0

Gracias Huang. Probé Notepad ++ y luego jEdit, que son compatibles con UTF-8. Los signos de interrogación aún no se convierten en los caracteres chinos. Por lo tanto, estoy pensando que Excel simplemente hace gárgaras con los caracteres chinos cuando importa la hoja de cálculo en formato CSV. Todavía estoy buscando una solución a esto. – user534017

Respuesta

2

Quizás quieras probar la libreta ++, dudo que la libreta admita caracteres Unicode.

http://notepad-plus-plus.org/

+0

El Bloc de notas admite caracteres Unicode si el archivo comienza con algo reconocido como una marca de orden de bytes, lo cual es algo realmente feo en UTF-8 (especialmente dado que UTF-8 _no lo necesita en primer lugar). –

+0

Hola, por encima, probé Notepad ++ y jEdit, que son compatibles con UTF-8. Una vez más, los signos de interrogación aún no se convierten en los caracteres chinos. Por lo tanto, estoy pensando que Excel simplemente hace gárgaras con los caracteres chinos cuando importa la hoja de cálculo en formato CSV. Todavía estoy buscando una solución a esto. – user534017

+0

Excel no exporta a CSV en UTF-8. Solo es compatible con UTF-8 en formato "Texto Unicode". – Nelson

8

Por lo que yo sé Excel no guarda los archivos CSV en cualquier codificación Unicode. He tenido problemas similares recientemente tratando de exportar un archivo como CSV con el símbolo £. Tuve la ventaja de poder usar otra herramienta por completo.

Mi versión de Excel 2010 puede exportar en formato Unicode File > Save As > Unicode Text (.txt), pero el resultado es un archivo codificado UCS-2 delimitado por tabuladores. No conozco nada de MySQL, salvo una breve mirada a las especificaciones y parece que maneja las importaciones delimitadas por tabulaciones y UCS-2. Puede valer la pena probar esta salida.

Editar: Además, siempre se puede abrir esta salida Unicode en Notepad ++ convertirlo en UTF-8 Encoding > Convert to UTF-8 without BOM Y posiblemente reemplazar todos los caracteres de tabulación con comas demasiado (Utilice el diálogo Reemplazar en el modo de búsqueda ampliado, \t en el cuadro Buscar y , . en el cuadro Reemplazar)

7

el siguiente método ha sido probado y utilizado para importar archivos CSV en MongoDB, así que debería funcionar:

  1. en la hoja de cálculo Excel, vaya a archivo> Guardar como.

  2. Nombre el archivo y elija Texto Unicode (* .txt) de la lista desplegable al lado de "Guardar como tipo", y luego haga clic en Guardar.

  3. Abra el archivo .txt unicode con su editor de texto preferido, por ejemplo, el Bloc de notas.

  4. Dado que nuestro archivo de texto Unicode es un archivo delimitado por tabulaciones y queremos convertir Excel a archivo CSV (separado por comas), debemos reemplazar todas las pestañas con comas.

  5. Seleccione un carácter de tabulación, haga clic con el botón derecho y seleccione Copiar en el menú contextual, o simplemente presione CTRL + C como se muestra en la captura de pantalla siguiente.

  6. Presione CTRL + H para abrir el cuadro de diálogo Reemplazar y pegar la pestaña copiada (CTRL + V) en el campo Buscar. Cuando haga esto, el cursor se moverá hacia la derecha para indicar que la pestaña se pegó. Escriba una coma en el campo Reemplazar con y haga clic en Reemplazar todo.

  7. Haga clic en Archivo> Guardar como, ingrese un nombre de archivo y cambie la codificación a UTF-8. Luego haz clic en el botón Guardar.

  8. cambiar la extensión .txt a .csv directamente en Guardar del Bloc de notas como de diálogo y seleccione Todos los archivos (.) junto a Guardar como tipo, como se muestra en la siguiente imagen.

  9. Abra el archivo CSV de Excel haciendo clic en Archivo> Abrir> Archivos de texto (.prn, .txt, .csv) y verifique si los datos están Correctos.

Fuente here

0

que han intentado todos los métodos anteriores para mis datos, pero no funciona bien para mis datos (chino simplificado, más de 700 Mb. Me han tratado de Windows chino y el sistema Inglés, Inglés y Chino Excel parece que Windows Excel no puede guardar en utf8, incluso dice que lo hace. Especifico el csv de uft8 en guardar como, pero cuando uso la 'hoja abierta' para detectar los parámetros de codificación, no es uft8, no es GB * también. Aquí está mi solución final.

(1) Descargar 'hoja abierta'.

(2) Ábralo correctamente. Puede desplazar el método de codificación hasta que vea el carácter chino que se muestra en la ventana de vista previa.

(3) Guárdelo como utf-8 (si desea utf-8).

PD: Necesita averiguar la codificación predeterminada en su sistema. En cuanto a como sé, Ubuntu se ocupa de UTF8 bien. Pero la ventana predeterminada chino simplificado comienza con GB **. Incluso si la codifica como utf8, aún, puede abrirla también de forma cocrrente. En mi caso, r no pudo abrir mi utf-8 csv, pero puede abrir la codificación GB *.

Estos métodos funcionan bien incluso si su archivo es muy grande. Algunas otras alternativas son las hojas de google (pero el tamaño del archivo puede ser limitado). Notepad ++ también funciona para archivos más pequeños.

Hay una manera de detectar los métodos de codificación abriendo su archivo y desplazándose a través de los métodos de codificación hasta que vea el chino correctamente.

Cuestiones relacionadas