Obtengo un archivo a través de un HTTP-Upload y necesito estar seguro de que es un archivo pdf. El lenguaje de programación es Python, pero esto no debería importar.Compruebe si un archivo PDF es válido (Python)
pensé en las siguientes soluciones:
Comprobar si los primeros bytes de la cadena son "% PDF". Esto no es una buena verificación pero evita que el uso cargue otros archivos accidentalmente.
Pruebe la libmagic (el comando "file" en el bash lo usa). Esto hace exactamente lo mismo cheque como 1.
Tome un lib y tratar de leer la página-conteo fuera del archivo. Si la lib es capaz de leer un conteo de páginas, debe ser un pdf válido. Problema: No sé un lib para Python que puede hacer esto
Así Alguien tiene alguna solución para un lib u otro truco?
Gracias
+1 por simplicidad. Si solo quieres estar bastante seguro de que lo que tienes es al menos intentar ser un PDF, esto es tanto simple como rápido. – technicalbloke