¿Hay alguna manera de corregir los caracteres que se muestran incorrectamente después de ejecutar este marcado html a través de phpquery :: newDocument? En el documento original, hay citas dobles en torno a "Clásicos con mujer moderna" que terminan exhibiéndose incorrectamente después de crear el nuevo documento con phpquery.Corregir la codificación mostrada incorrectamente en un documento html con php
//Original document is UTF-8 encoded
$raw_html = '<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /></head><body><p>Mr. Smith of Bangkok celebrated the “Classics with modern Woman”.</p></body></html>';
print($raw_html);
$aNew_document = phpQuery::newDocument($raw_html);
print($aNew_document);
salida original: el Sr. Smith, de Bangkok celebra los “clásicos con moderno de la mujer”.
Nuevo documento de salida: Sr. Smith de Bangkok celebró el Classics con la mujer moderna.
+1 porque he tenido este problema antes cuando estaba en Windows .... esto es Windows guardando archivos como CP1251 (o lo que sea la página de códigos). Todo debe guardarse siempre como UTF-8 y el contenido enviado también con UTF-8. Linux no tiene este problema :) –
@Yanick, lo mismo aquí. – shamittomar
intentado agregar-encabezado ("Content-Type: text/html; charset = UTF-8"); - en la parte superior del script, pero no lo solucionó. ¿Puedes expresar lo que quieres decir con la página que se guarda en este ejemplo? No creo que la página se guarde nunca, pero existe en la memoria en el servidor de Linux antes de ser recreada por phpquery :: newdocument(). Si es posible, ¿puede mostrar cómo insertar este código correctamente? ¿O cómo guardar el documento con la codificación correcta? Puedo estar haciendo algo mal. Gracias – JMC