2011-02-03 10 views
9

Necesito reconocer los números de la imagen de la cámara en el iPhone, en tiempo real. Sé que no habrá más de 5 dígitos en la imagen.¿Es posible el reconocimiento de números en iPhone en tiempo real?

¿Es este problema realista para resolver teniendo en cuenta las especificaciones computacionales del iPhone? ¿alguien tiene alguna experiencia en el uso de la biblioteca Tesseract OCR, y cree usted que podría resolverse mediante el uso de ella?

+0

posible duplicado de: http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone –

+0

@ Daniel: Mientras que la pregunta se refiere a cómo utilice Tesseract para leer números en cualquier imagen fija, esto está investigando la posibilidad de realizar este tipo de procesamiento a partir de una transmisión de video en vivo. Creo que hay suficiente diferencia aquí para justificar una nueva pregunta. –

Respuesta

1

Debería ser computacionalmente posible. Hay aplicaciones que pueden obtener un código de barras en tiempo real y también una aplicación que hace la traducción en tiempo real. (Lente de Word). Sin embargo, no estoy seguro de qué bibliotecas usan.

11

Depende de su definición de "tiempo real", pero sí, debería ser posible hacer un reconocimiento relativamente rápido de solo los dígitos 0-9 en un iPhone 4, especialmente si puede fuentes, condiciones de iluminación, etc. . que van a aparecer en.

Te recomiendo la lectura del artículo sobre how Sudoku Grab does its recognition of puzzles usando la cámara del iPhone. En su caso, se utilizó una red neuronal entrenada para identificar los dígitos, lo que debería ser razonablemente simple y rápido en el hardware iOS moderno.

El reconocimiento actual bibliotecas por ahí, como OpenCV, utilizará la CPU del iPhone para hacer el procesamiento. He oído que pueden hacer tareas aún más complejas, como el reconocimiento facial, lo suficientemente rápido como para usarlo con fuentes de video y al mismo tiempo mostrar una cantidad mínima de tartamudeo.

Para un rendimiento aún mejor, creo que hay un gran potencial en las GPU programables en los nuevos dispositivos IOS. En my benchmarks, vi una velocidad de 14X - 28X al usar la GPU del iPhone 4 para un procesamiento de imágenes simple. Si bien pocas personas lo están viendo ahora, algo así como la red neuronal de Sudoku Grab debería ser un proceso lo suficientemente paralelo para beneficiarse de la ejecución de la GPU.

+0

Trabajo útil http://www.benjaminloulier.com – iCoder86

0

Sí. Bender puede ayudarlo con eso. Te permite construir y ejecutar redes neuronales en iOS. Como usa metal debajo del capó, funciona rápido y sin problemas. También es compatible con ejecutar los modelos TensorFlow directamente.

para que pueda ejecutar en Bender un modelo existente en TensorFlow entrenados para el reconocimiento de dígitos Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras si necesita ayuda para

de responsabilidad: He trabajado en este proyecto.

0

Hay un SDK gratuito para eso: http://rtrsdk.com/ Admite iOS y Andorid, funciona en tiempo real, le ayuda a capturar cualquier texto, los números no deberían ser un problema.

responsabilidad: yo trabajo para ABBYY

Cuestiones relacionadas