2011-06-04 15 views
5

Intento expulsar texto del archivo Word .DOC con PHP. Todo parece estar bien, pero el único problema es algo así comoEntidades UTF-8 y HTML

СУДОВА БУХГАЛТЕРІЯ 

en lugar de texto en ruso. Intenté usar html_entity_decode y utf8_encode, pero no me ayudaron. ¿Hay alguna solución simple?

Respuesta

4

html_entity_decode debe trabajar con los parámetros adecuados (a menos que estés usando PHP 5.3.3 o posterior):

html_entity_decode($str, ENT_QUOTES, 'UTF-8') 

Esto convertirá las garantías de moralidad en UTF-8. Antes de PHP 5.3.3, el valor predeterminado del parámetro charset era ISO-8859-1. En ese caso, los caracteres cirílicos no se pueden convertir, ya que ISO 8859-1 character set no los contiene.

+0

Sí, funciona. Gracias. – Ximik

+0

p.s. Aceptaré tu respuesta después de 10 minutos de demora :) – Ximik

Cuestiones relacionadas