Estoy usando R 2.15.0 en Windows 7 de 64 bits. Me gustaría enviar texto Unicode (CJK) a un archivo.Salida de archivo UTF-8 en R
El código siguiente muestra cómo un carácter Unicode envió a escribir en una conexión de archivos UTF-8 no funciona como (I) que se espera:
rty <- file("test.txt",encoding="UTF-8")
write("在", file=rty)
close(rty)
rty <- file("test.txt",encoding="UTF-8")
scan(rty,what=character())
close(rty)
Como se muestra por la salida de exploración:
Read 1 item
[1] "<U+5728>"
El archivo no se escribió con el carácter UTF en sí, sino con algún tipo de respaldo de conformidad con ANSI. ¿Puedo hacer que funcione bien la primera vez (es decir, con un archivo de texto que tiene "在" en su lugar), o puedo trabajar algo de magia extra para convertir la salida a Unicode con el carácter adecuado reemplazando la cadena de código?
Gracias.
[Más información: el mismo código se comporta correctamente en Cygwin, R 2.14.2, mientras que 2.14.2 en Win7 también está roto. Es esto en mi final en alguna parte?]
[Actualización tardía] Los problemas tienden a ser * local * en lugar de codificación. He resuelto problemas de salida de galimatías cambiando temporalmente la configuración regional a algo "apropiado". Dios te ayudará si tienes datos de idiomas de más de un lugar. – Patrick
tal vez este [post] (http://stackoverflow.com/questions/11069908/r-extracting-clean-utf-8-text-from-a-web-page-scraped-with-rcurl?lq=1) ayuda. – DJJ