estoy usando iTextSharp
para leer el contenido de PDF documentos:iTextSharp excepción: la firma de cabecera PDF no encontró
PdfReader reader = new PdfReader(pdfPath);
using (StringWriter output = new StringWriter())
{
for (int i = 1; i <= reader.NumberOfPages; i++)
output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));
reader.Close();
pdfText = output.ToString();
}
99% de las veces funciona muy bien. Sin embargo, no es éste PDF archivo que a veces lanzar esta excepción:
PDF firma de cabecera no se encuentra. StackTrace: en iTextSharp.text.pdf.PRTokeniser.CheckPdfHeader() en iTextSharp.text.pdf.PdfReader.ReadPdf() en iTextSharp.text.pdf.PdfReader..ctor (filename String, Byte [] ownerPassword) en Reader.PDF.DownloadPdf (String url) en C: \ Documents \ Visual Studio
lo molesto es que no siempre se puede reproducir el error. A veces funciona, a veces no funciona. ¿Alguien ha encontrado este problema?
Me tomó un tiempo, pero finalmente me di cuenta de que el archivo fue hecho dañado. La culpa recae en el sitio web que creó el PDF, y no en un error con iTextSharp. Gracias por tomarse el tiempo para responder a mi pregunta. – broke
Puedo confirmar que esto puede ocurrir si carga el lector desde un dispositivo de vapor y desde el disco :) – JoshBerke
Resulta que estaba buscando el archivo incorrecto en mi caso. El nombre del archivo se refería a uno de los activos (imágenes) que estaba usando anteriormente, es decir, un jpg no es un pdf, doh :), por lo que era en realidad un PDF dañado (o no uno en absoluto). Gracias - me puso en el camino correcto. –