2009-12-15 8 views
7

He buscado OCR de código abierto para chino. Pero sin suerte, rara vez parece haber algún OCR de código abierto (para chino) que sea utilizable.OCR de código abierto para chino

Así que estoy aquí preguntando:

  1. ¿Hay alguna fuente abierta OCR para el chino que podría ser utilizado para el entorno de producción?

  2. ¿Cuáles son las principales diferencias al implementar un OCR para idiomas latinos y para chino? Conozco algunos buenos OCR como Tesseract u Ocropus, ¿qué debo hacer si quiero que sea compatible con chino?

Cualquier ayuda es apreciada y gracias de antemano ~

Respuesta

4

Se puede elegir:

  • Tesseract apoyo 3.0 chino/japonés apoyo
  • NHOCR japonés
+0

¿Tesseract 3.0 está disponible para su descarga ahora? ¿Dónde puedo encontrar su origen? –

+0

Puede consultar http://code.google.com/p/tesseract-ocr/source/checkout. –

0

China tiene ahora más caracteres que las lenguas latinas. Hay algunos productos comerciales. Una de las formas es ponerse en contacto con ellos y obtener ayuda.

No creo que haya una fuente abierta para caracteres chinos o japoneses. En el área de OCR, hay muchas técnicas más allá de los algoritmos de reconocimiento de patrones, donde una empresa es buena, no la comunidad de código abierto.

+0

me encontré un poco de código abierto OCR para los japoneses. Parece que no hay muchas opciones para los chinos. Todavía gracias ~ –

Cuestiones relacionadas