Estoy leyendo nombres de archivo del sistema de archivos y quiero enviarlos como una matriz codificada JSON. El problema es que los archivos en el sistema de archivos se pueden almacenar en una codificación no válida, y necesito manejar esta situación para omitir nombres de archivo no válidos antes de pasarlo al json.dump
, de lo contrario, fallará.Verificar la cadena utf8 válida en Python
¿Hay alguna manera de verificar que mi cadena (nombre de archivo) contiene caracteres utf-8 válidos?
impresionarme. * ¿Por qué * los archivos no tienen nombres de archivo UTF-8 válidos? –
es el nombre del archivo que no está codificado en utf-8 o son los datos en el archivo ?? estoy confundido. – mouad
¿Qué tal un software defectuoso que crea nombres de archivos basados en etiquetas ID3 sin verificar la codificación? ¿O montar (con las opciones incorrectas) un viejo sistema de archivos que usa una extraña codificación de caracteres para los nombres de archivo? –