¿Alguien sabe de una biblioteca C++ para tomar una imagen y realizar reconocimiento de imágenes para que pueda encontrar letras basadas en una fuente y/o altura de fuente determinada? Incluso uno que no le permite seleccionar una fuente sería bueno (por ejemplo: readLetters (Imagen de imagen).Biblioteca C++ para reconocimiento de imágenes: imágenes que contienen palabras en la cadena
Respuesta
He estado investigando esto mucho últimamente. Lo mejor es simplemente Tesseract. Si necesita un análisis de diseño en la parte superior del OCR, vaya con Ocropus (que a su vez usa Tesseract para hacer el OCR). El análisis de diseño se refiere a la capacidad de detectar la posición del texto en la imagen y hacer cosas como segmentación de líneas, segmentación de bloques, etc.
He encontrado algunos consejos muy buenos a través de la experimentación con Tesseract que vale la pena compartir. Básicamente tuve que hacer un montón de preprocesamiento para la imagen.
- Aumenta/reduce la imagen de entrada a 300 ppp.
- Elimina el color de la imagen. La escala de grises es buena. De hecho, utilicé un umbral de oscilación e hice mi entrada en blanco y negro.
- Recorta basura innecesaria de tu imagen. Para las tres anteriores utilicé netbpm (un conjunto de herramientas de manipulación de imágenes para Unix) para llegar al punto en el que obtuve una precisión del 100 por ciento de lo que necesitaba.
Si tiene una fuente altamente personalizada y va solo con tesseract, tiene que "entrenar" el sistema; básicamente, tiene que alimentar una gran cantidad de datos de entrenamiento. Esto está bien documentado en el sitio tesseract-ocr. Básicamente, crea un nuevo "idioma" para su fuente y lo pasa con el parámetro -l.
El otro mecanismo de entrenamiento que encontré fue con Ocropus usando el entrenamiento de net red (bpnet). Requiere una gran cantidad de datos de entrada para construir un buen modelo estadístico.
En términos de invocación de Tesseract/Ocropus son ambos C++. No será tan simple como ReadLines (Image), pero hay una API que puede consultar. También puede invocar a través de la línea de comando.
Aunque no puedo recomendar uno en particular, el término que está buscando es OCR (Reconocimiento óptico de caracteres).
Gracias, eso es útil. No pude encontrar nada en google con lo que estaba usando. – Zombies
hay tesseract-ocr que es una biblioteca profesional para hacer esto.
Desde allí sitio web
el motor Tesseract OCR fue uno de los 3 mejores motores de la prueba de precisión 1995 UNLV. Entre 1995 y 2006 tuvo poco trabajo hecho en él, pero es probable uno de los motores más precisos OCR de código abierto disponibles
Creo que lo que quiere es Conjecture. Solía ser el proyecto libgocr. No lo he usado durante algunos años, pero solía ser muy confiable si configuraba una clave.
El Tesseract OCR library da resultados bastante precisos, es una biblioteca C y C++. Mis resultados iniciales fueron aproximadamente del 80% de precisión, pero al aplicar el preprocesado en las imágenes antes de suministrar OCR, los resultados fueron aproximadamente del 95% de precisión. ¿Qué es pre-preprocesamiento:
1) Binarize el mapa de bits (B & W funcionó mejor para mí).How it could be done
2) Remuestreo su imagen a 300 ppp
3) guardar la imagen en un formato sin pérdida, como LZW TIFF o TIFF CCITT Grupo 4.
- 1. ¿Hay alguna biblioteca de reconocimiento de imágenes OK para .NET?
- 2. Reconocimiento de imágenes
- 3. Reconocimiento de imágenes de la biblioteca/API de código iPhone
- 4. C Biblioteca de imágenes
- 5. Buscando un AR con la biblioteca de reconocimiento de imágenes
- 6. Preprocesamiento de imágenes para reconocimiento de texto
- 7. reconocimiento de forma php en las imágenes
- 8. Biblioteca de imágenes simple C?
- 9. biblioteca que identifica imágenes similares
- 10. Reconocimiento de imágenes y representación en 3D
- 11. Reconocimiento de logotipo en las imágenes
- 12. Reconocimiento de imágenes para controlar la automatización de pruebas
- 13. ¿Una biblioteca para convertir svg en imágenes?
- 14. Envío de mensajes html Multipart que contienen imágenes incrustadas
- 15. pasos de aprendizaje para el algoritmo de reconocimiento de imágenes
- 16. Biblioteca de procesamiento de imágenes para Android?
- 17. Marco/guía para el reconocimiento de imágenes - Realidad Aumentada
- 18. Bibliotecas C++ para manipular imágenes
- 19. Biblioteca de procesamiento de imágenes para D?
- 20. Biblioteca de imágenes para Python 3
- 21. ¿Batch exporta imágenes de la Biblioteca?
- 22. Zooming con la biblioteca de imágenes de Python
- 23. Bibliotecas C++ para segmentación de imágenes
- 24. Reconocer imágenes en Python
- 25. Biblioteca de procesamiento de imágenes más rápido
- 26. Solr - sinónimos que contienen varias palabras
- 27. ¿Qué biblioteca de almacenamiento en caché de imágenes para iOS?
- 28. biblioteca de procesamiento de imágenes más rápida?
- 29. Amazon EC2 - Biblioteca de imágenes PHP GD
- 30. ¿Hay alguna biblioteca de reconocimiento facial C# que funcione?
saber de cualquier buena documentación para Ocropus .... especialmente una aplicación de C++. – Zombies
Lamentablemente, la mejor documentación está en su sitio web y leyendo los archivos de cabecera y los scripts de LUA que proporcionan. – Ish