Estoy consumiendo una fuente de datos que recientemente ha agregado un encabezado de lista de materiales Unicode (U + FEFF), y mi tarea de rastrillar ahora está en mal estado.Cómo evitar tropezar con BOM UTF-8 al leer archivos
Puedo omitir los primeros 3 bytes con file.gets[3..-1]
, pero ¿hay una forma más elegante de leer archivos en Ruby que puedan manejar esto correctamente, ya sea que haya una lista de materiales presente o no?
Eso es una lista de materiales Unicode no una UTF-8. – AnthonyWJones
Gracias, me acabo de dar cuenta de eso. En realidad son 3 bytes, no uno ... Edité la pregunta para decirlo. –