2010-06-02 10 views
53

Hasta este momento, no había encontrado una solución que funcionara bien para extraer texto de un archivo pdf en Objective C para usar en el iPhone. Encontré un código C estándar y lo modifiqué para que funcione, y pensé que lo proporcionaría aquí, ya que hasta este momento he usado stackoverflow bastante pero nunca he devuelto. Puede obtenerlo aquí: https://github.com/zachron/pdfiphoneExtrayendo texto en pdf en el Objetivo C

Toma como entrada la ruta del archivo pdf y devuelve un nsstring del texto en el pdf. No escribí la mayoría de esto, pero lo modifiqué para que funcionara con el iPhone y Objective C. Necesitas incluir la biblioteca Zlib en tu proyecto (libz.dylib en el iPhone) si alguien toma esto y hace es más increíble, son tiempos buenos.

+0

Esta sería una buena respuesta a esta pregunta: http://stackoverflow.com/questions/2362393/reading-pdf-files-as-string-through-iphone-application – Chetan

+13

favor expresarlo de otro modo como una pregunta y publique su solución como una respuesta en su lugar. –

+0

puede ser esto ayudaría .... http://stackoverflow.com/questions/2362393/reading-pdf-files-as-string-through-iphone-application –

Respuesta

5

Tenga en cuenta que esto solo funcionará para extraer texto que está almacenado como tal en el PDF. No escaneará archivos PDF con OCR. Si desea hacer eso, existe la opción de usar Tesseract, el robusto motor FOSS OCR de Google. Es compiles on the iPhone: ver Nolan Brown's Tesseract-iPhone-Demo para un ejemplo de trabajo. La biblioteca de imágenes ImageMagic also compiles on the iPhone, y le permitirá convertir PDF a TIFF, que Tesseract acepta como entrada.