La respuesta simple es SÍ, simplemente debe elegir las herramientas adecuadas.
No sé si alguna vez de código abierto puede acercarse al 100% de precisión en esas imágenes, pero en base a las respuestas aquí probablemente sí, si usted pasa algún tiempo en la formación y los análisis que resolver tabla de problemas y cosas por el estilo.
Cuando hablamos de OCR commertial como ABBYY u otro, le proporcionará una precisión del 99% o más y detectará las tablas automáticamente. Sin entrenamiento, nada, solo funciona.El inconveniente es que tienes que pagar $$. Algunos objetarían que para código abierto pagas tu tiempo para configurarlo y mantenerlo, pero todos deciden por sí mismo aquí.
Sin embargo, si hablamos de herramientas commertial, hay más posibilidades de elección en realidad. Y depende de lo que quieras. Los productos en caja, como FineReader, se están enfocando en la conversión de documentos de entrada en documentos editables como Word o Excell. Dado que realmente desea obtener datos, no el documento de Word, es posible que deba examinar diferentes categorías de productos: Captura de datos, que es esencialmente OCR más alguna lógica adicional para encontrar los datos necesarios en la página. En el caso de la factura podría ser el nombre de la empresa, la cantidad total, fecha de vencimiento, artículos de línea en la mesa, etc.
captura de datos es tema complicado y requiere un cierto aprendizaje, pero se utiliza correctamente puede conseguir una precisión quaranteed en la captura de datos de los documentos. Está utilizando diferentes reglas para la verificación cruzada de datos, búsquedas en la base de datos, etc. Cuando sea necesario, puede enviar datos para la verificación manual. Las empresas utilizan ampliamente aplicaciones de Captura de Datos para ingresar millones de documentos cada mes y dependen en gran medida de los datos extraídos en su flujo de trabajo diario.
y también hay OCR SDK por supuesto, que le dará acceso a la API a los resultados del reconocimiento y usted será capaz de programar qué hacer con los datos.
Si describe su tarea con más detalle lo que puedo ofrecerle un asesoramiento qué dirección es más fácil ir.
ACTUALIZACIÓN
Así que lo que hacen es básicamente la aplicación de captura de datos, pero no totalmente automatizada, utilizando la llamada "clic para indexar" enfoque. Hay una cantidad de aplicaciones similares en el mercado: escanea imágenes y el operador hace clic en el texto de la imagen (o dibuja un rectángulo alrededor) y luego rellena los campos en la base de datos. Es un buen enfoque cuando la cantidad de imágenes para procesar es relativamente pequeña, y la carga de trabajo manual no es lo suficientemente grande como para justificar el costo de una aplicación totalmente automatizada (sí, hay sistemas totalmente automatizados que pueden hacer imágenes con diferente fuente, espacio, distribución, número de filas en las tablas, etc.).
Si decidió desarrollar cosas y en lugar de comprar, entonces todo lo que necesita aquí es elegir OCR SDK. Toda la UI te vas a escribir, ¿verdad? La gran elección es decidir: de código abierto o comercial.
fuente abierta es mejor Tesseract OCR, por lo que yo sé. Es gratis, pero puede tener problemas reales con el análisis de tablas, pero con el enfoque de zonificación manual, este no debería ser el problema. En cuanto a la precisión de OCR, las personas a menudo entregan OCR para la fuente para aumentar la precisión, pero este no debería ser el caso, ya que las fuentes podrían ser diferentes. Por lo tanto, puedes probar tesseract y ver qué precisión obtendrás; esto influirá en la cantidad de trabajo manual para corregirlo.
commertial OCR dará una mayor precisión, pero le costará dinero. Creo que deberías echarle un vistazo para ver si vale la pena, o tesserack es lo suficientemente bueno para ti. Creo que la forma más sencilla sería descargar la versión de prueba de un producto de OCR de caja como FineReader. Obtendrá una buena idea de qué precisión habría en OCR SDK.
https://softwarerecs.stackexchange.com/questions/34358/program-to-generate-a-csv-file-from-an-image-containing-a-table –