http://code.google.com/p/tesseractdotnet/Tesseract 3 (OCR) - .NET Envoltura
estoy teniendo problemas para conseguir Tesseract a trabajar en mi Visual Studio 2010 proyectos. He intentado consola y winforms y ambos tienen el mismo resultado. Me he encontrado con un DLL por otra persona que dice tener que trabajar en VS2010
:
http://code.google.com/p/tesseractdotnet/issues/detail?id=1
Estoy añadiendo una referencia a la DLL que se puede encontrar en el documento adjunto a publicar 64 de la citada página web. Cada vez que construyo mi proyecto recibo un AccessViolationException
diciendo que se intentó leer o escribir en la memoria protegida.
public void StartOCR()
{
const string language = "eng";
const string TessractData = @"C:\Users\Joe\Desktop\tessdata\";
using (TesseractProcessor processor = new TesseractProcessor())
{
using (Bitmap bmp = Bitmap.FromFile(fileName) as Bitmap)
{
if (processor.Init(TessractData, language, (int)eOcrEngineMode.OEM_DEFAULT))
{
string text = processor.Recognize(bmp);
}
}
}
}
La excepción violación de acceso siempre apunta a if (processor.Init(TessractData, language, (int)eOcrEngineMode.OEM_DEFAULT))
. He visto algunas sugerencias para asegurarme de que la plataforma de la solución esté configurada en x86
en el administrador de configuración y que la ubicación de la carpeta tessdata haya finalizado con una barra inclinada final, sin éxito. ¿Algunas ideas?
¿puede compartir la implementación completa? Creo que estoy leyendo instrucciones contradictorias sobre cómo configurar esto. – Roger
No puedo tomar el crédito pero esto funcionó para mí: reemplace 'eng.traineddata' en la carpeta tessdata con este http://code.google.com/p/tesseract-ocr/downloads/detail?name=eng.traineddata. gz – Alex