2009-08-14 19 views
5

Cuando miro la fuente de datos XML que obtengo con el siguiente código, los caracteres especiales son correctos en el código XML. Sin embargo, cuando Curl devuelve los datos, los caracteres como "ó" y "ä" se convierten en resp. "О" y "ä". Esta conversión sucede a todos los caracteres especiales, estos 2 son solo un ejemplo.caracteres modificados en una solicitud Curl

$myvar = curl_init(); 
$myURL = "http://someurl.com/"; 
curl_setopt($myvar, CURLOPT_USERAGENT, '[Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2) Gecko/20070219 Firefox/2.0.0.2")]'); 
curl_setopt($myvar, CURLOPT_URL, $myURL); 
curl_setopt($myvar, CURLOPT_RETURNTRANSFER, TRUE); 
curl_setopt($myvar, CURLOPT_TRANSFERTEXT, TRUE); 
curl_setopt($myvar, CURLOPT_CONNECTTIMEOUT,3); 
$xmlstr = curl_exec ($myvar); 

La cabecera del archivo XML dice para codificar como sigue "? Xml version =" 1.0" encoding = "UTF-8"?"

Todo lo que quiero es obtener los mismos caracteres para que aparezcan en el resultado de Curl sin ninguna transformación.

Esperando que me perdí un paso fácil, esperando cualquier respuesta.

Saludos Fons

Respuesta

6

, ¿cómo saber $xmlstr contiene los bytes mal? Si está mirando la salida en una ventana de terminal de algún tipo, es probable que el problema sea que la terminal no es compatible con UTF-8, no que la cURL esté rota.

cURL no se preocupa por UTF-8 ni por ninguna otra codificación de caracteres; su trabajo consiste simplemente en obtener una secuencia de bytes de alguna parte. No es probable que esté haciendo algo que destruya personajes especiales. Si hay algún problema con la forma en que usas cURL, se destruirá todo, no solo los caracteres que no sean ASCII.

+0

@Ionut - ¡gracias, no sé qué me pasó! –

+0

Cuando uso echo $ xmlstr y miro en el archivo de origen, los caracteres están ocultos. Yo uso

como encabezado para la salida (html) su sugerencia es cambiar eso? de lo que sería muy feliz de saber qué encabezado usar en su lugar. respecto Fons – Fons

+6

Trate de añadir '' en la parte superior de la sección ... '' . –

Cuestiones relacionadas