Biblioteca C++ para reconocimiento de imágenes: imágenes que contienen palabras en la cadena

¿Alguien sabe de una biblioteca C++ para tomar una imagen y realizar reconocimiento de imágenes para que pueda encontrar letras basadas en una fuente y/o altura de fuente determinada? Incluso uno que no le permite seleccionar una fuente sería bueno (por ejemplo: readLetters (Imagen de imagen).Biblioteca C++ para reconocimiento de imágenes: imágenes que contienen palabras en la cadena

Fuente

2009-01-20 Zombies

He estado investigando esto mucho últimamente. Lo mejor es simplemente Tesseract. Si necesita un análisis de diseño en la parte superior del OCR, vaya con Ocropus (que a su vez usa Tesseract para hacer el OCR). El análisis de diseño se refiere a la capacidad de detectar la posición del texto en la imagen y hacer cosas como segmentación de líneas, segmentación de bloques, etc.

He encontrado algunos consejos muy buenos a través de la experimentación con Tesseract que vale la pena compartir. Básicamente tuve que hacer un montón de preprocesamiento para la imagen.

Aumenta/reduce la imagen de entrada a 300 ppp.
Elimina el color de la imagen. La escala de grises es buena. De hecho, utilicé un umbral de oscilación e hice mi entrada en blanco y negro.
Recorta basura innecesaria de tu imagen. Para las tres anteriores utilicé netbpm (un conjunto de herramientas de manipulación de imágenes para Unix) para llegar al punto en el que obtuve una precisión del 100 por ciento de lo que necesitaba.

Si tiene una fuente altamente personalizada y va solo con tesseract, tiene que "entrenar" el sistema; básicamente, tiene que alimentar una gran cantidad de datos de entrenamiento. Esto está bien documentado en el sitio tesseract-ocr. Básicamente, crea un nuevo "idioma" para su fuente y lo pasa con el parámetro -l.

El otro mecanismo de entrenamiento que encontré fue con Ocropus usando el entrenamiento de net red (bpnet). Requiere una gran cantidad de datos de entrada para construir un buen modelo estadístico.

En términos de invocación de Tesseract/Ocropus son ambos C++. No será tan simple como ReadLines (Image), pero hay una API que puede consultar. También puede invocar a través de la línea de comando.

Fuente

2009-01-23 07:20:30 Ish

saber de cualquier buena documentación para Ocropus .... especialmente una aplicación de C++. – Zombies

Lamentablemente, la mejor documentación está en su sitio web y leyendo los archivos de cabecera y los scripts de LUA que proporcionan. – Ish

Aunque no puedo recomendar uno en particular, el término que está buscando es OCR (Reconocimiento óptico de caracteres).

Fuente

2009-01-20 20:06:10 Sparr

Gracias, eso es útil. No pude encontrar nada en google con lo que estaba usando. – Zombies

hay tesseract-ocr que es una biblioteca profesional para hacer esto.

Desde allí sitio web

el motor Tesseract OCR fue uno de los 3 mejores motores de la prueba de precisión 1995 UNLV. Entre 1995 y 2006 tuvo poco trabajo hecho en él, pero es probable uno de los motores más precisos OCR de código abierto disponibles

Fuente

2009-01-20 20:06:36 Damien

Creo que lo que quiere es Conjecture. Solía ser el proyecto libgocr. No lo he usado durante algunos años, pero solía ser muy confiable si configuraba una clave.

Fuente

2009-01-20 20:07:51 sig11

El Tesseract OCR library da resultados bastante precisos, es una biblioteca C y C++. Mis resultados iniciales fueron aproximadamente del 80% de precisión, pero al aplicar el preprocesado en las imágenes antes de suministrar OCR, los resultados fueron aproximadamente del 95% de precisión. ¿Qué es pre-preprocesamiento:

1) Binarize el mapa de bits (B & W funcionó mejor para mí).How it could be done

2) Remuestreo su imagen a 300 ppp

3) guardar la imagen en un formato sin pérdida, como LZW TIFF o TIFF CCITT Grupo 4.

Fuente

2016-12-21 04:43:06 currentX

Biblioteca C++ para reconocimiento de imágenes: imágenes que contienen palabras en la cadena

Respuesta

Cuestiones relacionadas