2010-11-15 14 views
5

Hola a todos Tengo una colección de imágenes que son similares a las fotos de las matrículas de automóviles.ocr y técnicas de preprocesamiento de imágenes

Me pregunto cómo procesar previamente la imagen antes de enviarla a un motor de OCR para determinar el texto.

Me gustaría eventualmente poder recortar la entrada solo en el contenido en blanco de la placa de registro.

La imagen real sería algo como esto:

input

y debe llegar a algo como esto (profundidad de color no es importante) ouput

Gracias por cualquier ayuda. Saludos, Bob

Respuesta

5
  • segmentar la imagen (echar un vistazo a this).

  • Clasifique los segmentos usando un umbral de escala de grises (ya que solo está buscando blanco).

  • Recorte la imagen utilizando el cuadro delimitador de segmentos blancos (o cuadros delimitadores, si se divide en más de un segmento). Esto probablemente no vaya a funcionar para autos blancos - pero no debería ser demasiado difícil establecer algunas reglas para este caso.

  • Eche un vistazo a tesseract-ocr para extraer el texto.

+0

Hola Vitor, gracias por eso. –

+0

Ya estoy buscando en tesseract y funciona muy bien ... una vez que el procesamiento de imágenes funciona bien :) –

+0

Solo pregúntale si tienes algún problema :) –

Cuestiones relacionadas