Tengo un conjunto de documentos de Word que deseo publicar utilizando una herramienta PHP que he escrito. Copio y pego los documentos de Word en un cuadro de texto y luego los guardo en MySQL usando el programa PHP. El problema que tengo surge de todos los caracteres no estándar que tienen los documentos de Word, como comillas y elipsis ("..."). Lo que hago en este momento es buscar manualmente y reemplazar este tipo de cosas (y también símbolos extraños como e-acute) con texto sin formato o entidades HTML (& eacute; etc) ¿Hay una función en PHP que puedo llamar que lo haga? tomar el resultado de un documento de Word y convertir todo lo que debe ser entidades en entidades, y otros símbolos que no se muestran correctamente en Firefox en los símbolos que se muestran.Convertir un documento de Word en HTML utilizable en PHP
Gracias!
En mi experiencia, incluso con todas las codificaciones de caracteres establecidos derecha, algunos caracteres simplemente tragado por el momento en que llegan al navegador. No sé si esto es un error en PHP (el lenguaje de servidor que uso más) o qué, pero he encontrado que la conversión a entidades es más confiable. – eyelidlessness
Hola Richard, ¿algún consejo sobre cómo configurar MySQL para que sea compatible con UTF-8? Gracias! – Ben
CREATE DATABASE db_name CHARACTER SET 'utf8' - ver http://dev.mysql.com/doc/refman/5.0/en/charset-database.html y http://dev.mysql.com/doc/refman/5.0 /en/charset-table.html. Tenga en cuenta que tendrá que hacer algo como SET NAMES 'utf8'; cuando se conecta a la base de datos para asegurarse de que obtiene datos en UTF-8. –