Tengo un montón de archivos csv
que estoy leyendo en R y que están incluidos en una carpeta de paquete/datos en el formato .rdata
. Lamentablemente, los caracteres que no son ASCII en los datos no pasan el control. El paquete tools
tiene dos funciones para buscar caracteres que no sean ASCII (showNonASCII
y showNonASCIIfile
) pero parece que no puedo encontrar uno para eliminarlos/limpiarlos.Eliminando caracteres no ASCII de archivos de datos
Antes de explorar otras herramientas de UNIX, sería genial hacerlo todo en R para poder mantener un flujo de trabajo completo desde los datos sin procesar hasta el producto final. ¿Hay algún paquete/función existente que me ayude a deshacerme de los caracteres que no son ASCII?
Pruebe con expresiones regulares, por ejemplo, la función gsub. Check? Regexp – aatrujillob
Sabe que 'read.csv()' toma un argumento 'encoding', por lo que puede manejar estos, al menos en R? ¿Qué comprobación específica fallan los caracteres que no son ASCII, está en R (si es así, publíquela aquí) o externa? – smci