2010-02-19 13 views

Respuesta

3

Viniendo de un fondo de Zend, generalmente recomiendo usar Zend_Search_Lucene. El ejemplo de XPDF es realmente directo y parece simple. XPDF tiene licencia como GPL. Si cumple con sus necesidades, obtenga el n. ° 1.

ZF se puede integrar fácilmente en sus proyectos de Symfony, p. para un Twitter Call.

2

Hay muchas bibliotecas para extraer contenido de texto de PDF. Con cualquiera de estos, debe crear un documento lucene con el contenido. Los más útiles serán aquellos que ya tienen integración lucene.

Apache PDFBox puede create a lucene documento directamente desde el archivo PDF. Incluirá los campos de metadatos de PDF, así como el contenido de texto.