¿Hay alguna herramienta para encontrar la ubicación X-Y en un contenido de texto en un archivo pdf?Cómo encontrar la ubicación x, y de un texto en pdf
Respuesta
Intenta ejecutar "Preflight ..." en Acrobat y elige PDF Analysis -> List page objects, grouped by type of object
.
Si encuentra los objetos de texto dentro de la lista de resultados, notará que hay un valor de posición (en puntos) dentro de la sección Text Properties -> * Font
.
Docotic.Pdf Library puedo hacerlo. Ver C# muestra a continuación:
using (PdfDocument doc = new PdfDocument("your_pdf.pdf", "password_if_need"))
{
foreach (PdfTextData textData in doc.Pages[0].Canvas.GetTextData())
Console.WriteLine(textData.Position + " " + textData.Text);
}
TET, el kit de herramientas de extracción de texto de la pdflib familia de productos puede hacer eso. TET tiene una interfaz de línea de comandos, y es la más poderosa de todas las herramientas de extracción de texto que conozco. (Incluso puede manejar ligaduras ...)
Geometría
TET proporciona métricas precisas para el texto, tales como la posición en la página, ancho de los signos, y la dirección del texto. Las áreas específicas en la página se pueden excluir o incluir en la extracción de texto, p. ignorar encabezados y pies de página o márgenes.
- 1. ¿Cómo puedo encontrar la ubicación del cursor (X/Y, no línea/columna) en un área de texto HTML?
- 2. PDF Análisis con texto y coordenadas
- 3. Determinar la ubicación y de un carácter para representar texto
- 4. ITextSharp insertar texto en un pdf existente
- 5. ¿Cómo extraer texto de un PDF?
- 6. ¿Encontrar hipervínculos dentro de un documento PDF?
- 7. Encontrar la posición del cursor en un cuadro de texto
- 8. Cómo encontrar elemento en Vista por coordenadas x, y Android
- 9. Cómo encontrar periódicamente la ubicación de GPS en Android
- 10. ¿Cómo colocar un objeto en una ubicación específica (x, y) en un JFrame?
- 11. Cómo encontrar y reemplazar texto en un archivo PDF existente con PDFTK (u otra aplicación de línea de comandos)
- 12. Cómo encontrar la ubicación del mouse en Objectivo-c
- 13. volcando el documento PDF (* .pdf) al texto?
- 14. Cómo encontrar la página en blanco en el archivo pdf
- 15. ¿Cómo puedo encontrar la ubicación del ejecutable en C?
- 16. Extracción simple de texto PDF en Android?
- 17. Texto en hebreo en PDF
- 18. php cómo encontrar la ubicación de donde vino el usuario?
- 19. Cómo encontrar texto y reemplazarlo usando jQuery
- 20. ¿Cómo agrego texto a la ubicación del cursor de un usuario en un cuadro de texto enriquecido en C#?
- 21. Ubicación de datos compartidos para Linux y Mac OS X
- 22. ¿Cómo encontrar la ubicación más cercana utilizando latitud y longitud desde la base de datos sql?
- 23. Cómo reemplazar texto en un PDF con C#?
- 24. Dado un PDF, ¿cómo extraer las imágenes * y sus ubicaciones en la página * desde la línea de comandos?
- 25. ¿Cómo encontrar la URL de ubicación en un objeto de respuesta de Django?
- 26. Cómo encontrar su ubicación actual con CoreLocation
- 27. Cómo encontrar archivos DLL cargados en un proceso y su ubicación, etc.
- 28. Encontrar los ángulos para los ejes X, Y y Z en 3D - OpenGL/C++
- 29. Javascript/jquery, obtenga la ubicación de todos los divs en (x, y). Toques de reenvío?
- 30. PDF Búsqueda de texto C#
¿es posible encontrar la posición x, y y la altura, el ancho de cada palabra? – raki
@raki: donde está la posición, el tamaño está justo debajo, pero eso es solo para un bloque de texto, que puede ser cualquier texto arbitrario. Para obtener tamaños de palabra individuales, sería necesario calcular las métricas de fuente. Cuál es el propósito de lo que estás haciendo, puede haber un mejor enfoque. – Orbling