¿Cómo se lee el archivo PDF y se pone el contenido en la cadena? Usando lenguaje PHP.Conversión de PDF a la cadena
Respuesta
Usted puede encontrar útil este tutorial: http://www.webcheatsheet.com/php/reading_clean_text_from_pdf.php
Se podría utilizar algo como pdftotext que viene con el paquete Xpdf en Linux. El comando popen continuación, se puede utilizar para canalizar la salida de pdftotext en una cadena:
$mystring = "";
$fd = popen("/usr/bin/pdftotext blah.pdf","r");
if ($fd) {
while (($myline = fgets($fd)) !== false) {
$mystring .= $myline;
}
}
Enlace de descarga para xpdf: https://www.xpdfreader.com/download.html y enlace a popen: http://php.net/manual/en/function.popen.php – kurdtpage
encontrado esta clase muy agradable! Además, puede agregar funcionalidad para satisfacer sus necesidades.
Probablemente estos le ayudarán a agregar funciones:
Si no funciona, compruebe si puede resaltar/marcar su texto al abrir en Adobe Reader (si no puede, el texto de su archivo probablemente se guarda como curvas geométricas), verifique también la codificación.
Instale APACHE-TIKA en su servidor. APACHE-TIKA admite más archivos pdf. Guía de instalación: http://www.acquia.com/blog/use-apache-solr-search-files
y último código es fácil:
$string = "";
$fd = popen("java -jar yourpathtotika/tika-app-1.3.jar -t yourpathtopdf/sample.pdf","r");
while (!feof($fd)) {
$buffer = fgets($fd, 4096);
$string .= $buffer;
}
echo $string;
Usted puede utilizar la clase PHP que está disponible aquí:
Se trata de un texto de un PDF de dominio público extractor completamente escrito en PHP puro, lo que significa que no necesita depender de comandos externos. Proporciona una interfaz sencilla para recuperar el texto:
include ('PdfToText.phpclass') ;
$pdf = new PdfToText ('mysample.pdf') ;
echo "PDF contents are : " . $pdf -> Text . "\n" ;
- 1. conversión de PDF a imagen
- 2. De PDf a cadena
- 3. Conversión de HTML a PDF en iOS?
- 4. Conversión de PDF a JPG usando PHP
- 5. Conversión de PDF a HTML con Python
- 6. conversión de pdf a xml usando .NET
- 7. Ruby - cadena de conversión a la fecha
- 8. Conversión de la cadena Haml a html
- 9. Java: inetaddress a la conversión de cadena
- 10. Cadena de conversión Sqlite a la fecha
- 11. PHP LaTeX a PDF Conversión/compilación
- 12. conversión de cadena estrecha a cadena ancha
- 13. Conversión de cadena a entero
- 14. conversión de cadena a numérico
- 15. cadena a la conversión DateTime en C#
- 16. La conversión a TCHAR cadena en C++
- 17. cadena a la conversión enum en C#
- 18. cadena a flote la conversión - separador decimal
- 19. Conversión de HTML a PDF (no PDF a HTML) usando PHP
- 20. Conversión de documentos de MS Word a PDF en ASP.NET
- 21. Conversión de PDF a Word de alta calidad en PHP?
- 22. Conversión de PDF a TIFF o texto en C#
- 23. conversión de XML a cadena usando C#
- 24. Conversión de Unicode a cadena en Java
- 25. Conversión de archivo binario a cadena Base64
- 26. Conversión de un vector a cadena
- 27. Conversión de cadena a puntero para JNA
- 28. Cadena de C++ a doble conversión
- 29. z3python: conversión de cadena a expresión
- 30. cacao - conversión de un doble a cadena
Uso [ 'file_get_contents'] (http://de3.php.net/manual/en/function.file-get-contents.php) si necesita la datos binarios en bruto o actualiza tu pregunta y cuéntanos qué es lo que realmente quieres. –
Necesito obtener un texto limpio de los archivos pdf. Cuando obtengo texto de archivos PDF, necesito insertar este texto en DB. – lolalola