Necesito cambiar programáticamente la codificación de un conjunto de scripts * nix a UTF-8 desde Java. No les escribiré nada, así que estoy tratando de encontrar cuál es la forma más fácil de hacerlo. Los archivos no son demasiados y no son tan grandes. Pude:¿Cambiar la codificación del archivo existente con Java?
- "escribir" una cadena vacía utilizando un OutputStream con UTF-8 como codificación
- Puesto que ya estoy usando FileUtils (de Apache Commons), que podía leer | escribir los contenidos de las mismas archivos, pasando UTF-8 como codificación
No es un gran problema, pero ¿alguien se ha encontrado con este caso antes? ¿Hay algún inconveniente en ambos enfoques?
El archivo completo * debe ser leído y re-escrito * excepto en el caso de archivos ASCII limpios normales de 7 bits (y similares) que no requieren una lista de materiales inicial. La lista de materiales cambiará la secuencia así como cualquier cambio de codificación. –
Pero la codificación predeterminada de Unixes es UTF-8, creo. ¿Cuál es la codificación de tus scripts? – Cratylus
@ user384706 Quizás sea más apropiado decir que las secuencias que no son de BOM se toman como UTF-8 en muchas aplicaciones de "texto" ... es más apropiado hablar de una "codificación predeterminada" en relación con un idioma/biblioteca/API. –