Intentar utilizar el curl de linux para descargar un archivo xml de una url.curl de linux guardar como utf-8
bastante seguro de que el XML está codificado en UTF-8,
sospechar rizo -o duerma guardar como UTF-8.
¿Hay alguna forma de forzar guardar en UTF-8 con curl?
Gracias por la sugerencia, lo que descubrí:
Debido a que la alimentación XML es dinámica, no todo el tiempo que contienen caracteres UTF-8. A veces no tiene el carácter utf-8 en todo el contenido, a pesar de que está configurado como utf-8 en el tipo de contenido de encabezado y codificación xml: charset = utf-8. Cuando contiene un carácter utf-8 como mínimo, se guardará como utf-8.
Cuando esto sucede, curl no se descarga como utf-8, lo que tiene sentido ya que no hay caracteres utf-8, ¿por qué hay una necesidad de almacenar como utf-8.
Esto es muy complicado, algún validador tiene que ser válido contra utf-8, por lo tanto, todavía necesito una solución para forzarlo a utf8 porque de manera predeterminada todos mis xml shld están en codificación utf8.
intenté lo sugerido usando iconv f iso8859-1 utf-8 no funciona para este caso ya que sospecho que tampoco está en iso8859-1.
Todavía necesitamos una mejor solución.
no creo 'curl' hace ninguna modificación en absoluto a lo que se obtiene, y desde luego no vuelve a codificar el texto. – geoffspear
hola gracias ... sin embargo, no estoy buscando volver a codificar los datos, solo me pregunto por qué no está guardando como utf-8, mientras que los contenidos son alr utf-8 – flyclassic
¿Qué te hace pensar que no está guardando como utf-8? ¿Qué estás realmente tratando de lograr? – geoffspear