Necesito convertir texto en UTF-8 en texto codificado en ISO-8859-1 de manera que cualquier carácter que no forme parte del conjunto ISO-8859-1 se convierta en referencias de caracteres. (Ex β
)Convierte utf8 a latin1 en PHP. Todos los caracteres superiores a 255 se convierten en referencias de caracteres
Ejemplo: Quiero convertir texto como
hello é β 水
en
hello é β 水
que estoy haciendo todo esto en PHP. Probé las funciones integradas, iconv, ordenadas y combinadas, y aún no puedo obtener una solución confiable.
Esto es lo que tengo hasta ahora
// convert any characters fount in the entity table into HTML entities
// do not double encode entities, do not mess with quotes
// use UTF-8 as character encoding because the page submits UTF-8
$str = htmlentities($str,ENT_NOQUOTES,'UTF-8',false);
//print $str."\n";
// convert text from UTF-8 to ISO-8859-1,
// characters that cannot be converted will be converted to ?
$str = utf8_decode($str);
//print $str."\n";
// make string XML valid.
// mainly it converts text entities into numeric entities.
$opts = array( "output-xhtml" => true,
"output-xml" => true,
"show-body-only" => true,
"numeric-entities" => true,
"wrap" => 0,
"indent" => false,
"char-encoding" => 'latin1'
);
$tidy = tidy_parse_string($str, $opts,'latin1');
tidy_clean_repair($tidy);
$str = tidy_get_output($tidy);
//print $str."\n";
usando 'htmlentities ('hola é β 水', ENT_COMPAT, ' UTF-8 ') 'podría convertir al menos el' é' y el 'β' en entidades HTML (entidades con nombre). ¿Esto es suficiente? – NikiC
Por supuesto, esto no es suficiente. El último personaje es el principal problema aquí. Por favor no, que las entidades no están permitidas en el resultado final (datos XML) y quiero que ISO-8859-1 se mantenga como caracteres. –