Estoy creando un servicio que supervisa una carpeta para archivos escaneados. Una vez que el archivo está allí, el servicio lo recoge y lo convierte en un PDF legible. En este proceso, el servicio también busca un código de barras. Después de esto, el texto se extrae y el archivo, con su texto, se almacena en la base de datos de nuestro software. La ubicación se basa en el código de barras.Cómo mejorar la calidad de PDF antes de utilizar OCR C#
Ahora, para el OCR estamos utilizando el SDK de Atalasoft (http://www.atalasoft.com/). También el reconocedor de código de barras está incluido en este SDK.
Pero el texto convertido todavía tiene algunos errores. (Realicé algunas pruebas con otros programas de OCR, pero Atalasoft salió bien). Estoy buscando algún software (SDK-kit) que me permita mejorar la calidad del PDF para propósitos de OCR.
He probado Kofax VRS Elite (http://www.kofax.com/vrs-virtualrescan/). Estoy buscando algo similar, pero eso se puede implementar en el servicio usando algún tipo de SDK-kit.
¿Alguien que hizo esto antes, o tuvo problemas similares? thx de antemano!
Hola, gracias por tu respuesta. Pero la opción de comprar otro escáner no está disponible. Y realicé algunas pruebas con abbyy, la calidad es comparable con el OCR de atalasoft. Anny otras sugerencias? –