2012-06-20 16 views
7

Tengo un archivo Excel en el idioma bengalí. Para mostrar el texto bengalí correctamente, necesito fuentes bengalíes instaladas en la PC.texto en idioma bengalí no se muestra en el archivo CSV Unicode

Convertí el archivo Excel en CSV usando Office 2010. Pero solo muestra '?' marcas en lugar de los caracteres bengalíes. Luego usé Google Docs para la conversión, con el mismo problema, pero con caracteres ilegibles en lugar de '?' S. Pegué extractos de ese archivo en un archivo HTML e intenté verlo en mi navegador sin éxito.

¿Qué debo hacer para obtener un archivo CSV de un archivo .xlsx en bengalí para poder importarlo a una base de datos MySQL?

Editar: La respuesta aceptada en this SO pregunta me hizo ir a Google Docs.

Respuesta

3

De acuerdo con las respuestas a la pregunta Excel to CSV with UTF8 encoding, Google Docs debe guardar CSV correctamente, contrario a Excel, que destruye todos los caracteres que no son representables en la codificación "ANSI" que se utiliza. Pero tal vez cambiaron esto, o algo mal, o el análisis de la situación es incorrecto.

Para una codificación adecuada de Bangla (bengalí) procesada en programas de MS Office, no debería haber ninguna "fuente Bangla", ya que la fuente Arial Unicode MS (enviada con Office) contiene los caracteres Bangla. Entonces, ¿los datos están realmente en alguna codificación no estándar que se basa en una fuente especialmente codificada? En ese caso, primero se debe convertir a Unicode, aunque posiblemente se pueda administrar de alguna manera usando programas que usen constantemente esa fuente específica.

En Excel, al usar Guardar como, puede seleccionar "Texto Unicode (* .txt)". Guarda los datos como TSV (valores separados por tabuladores) en codificación UTF-16. Es posible que deba convertirlo para usar coma como separador en lugar de pestaña, y/o de UTF-16 a UTF-8. Pero esto solo funciona si los datos originales están codificados correctamente.

+0

cómo hacer esa conversión para usar coma como separador en lugar de pestaña, y/o de UTF-16 a UTF-8? El archivo de Excel mostró bien las fuentes de Bangla. Entonces puedo suponer que los datos originales fueron codificados correctamente. derecho ? –

+0

Hice la conversión seleccionando el tipo 'guardar como' como 'texto unicode (.txt)', pero aún esos '?' las marcas aparecieron como antes. –

+0

@Istiaque Ahmed, realmente parece que los datos originales no están codificados correctamente. Si usa una codificación no estándar de 8 bits, puede parecer correcta en programas que usan una fuente específica, pero no funciona cuando se usan fuentes normales, y las conversiones de datos pueden estropear los datos. ¿Qué fuente de Bangla está usando? –

Cuestiones relacionadas