Según su experiencia, ¿cuál es la biblioteca/software de reconocimiento óptico de caracteres (OCR) de fuente abierta más preciso para leer texto en japonés?OCR de código abierto más preciso para japonés?
Acabo de probar nhocr, su tasa de error es más del 2% incluso en un documento de alta definición extremadamente limpio.
Por lo que vale, el 2% no es terrible para OCR. Luchamos por conseguir eso con, uhm, Romaji. –
2% es para caracteres ultra limpios en letra grande. Para los libros escaneados es mucho peor, y mucho menos los formularios manuscritos. –