2010-04-05 14 views

Respuesta

1

No estoy seguro exactamente de lo que está preguntando. Si está preguntando cómo se puede usar FFT para el reconocimiento de imágenes, aquí hay algunos pensamientos.

FFT se puede utilizar para realizar la "clasificación" de imágenes. No se puede usar para reconocer caras u objetos diferentes, pero se puede usar para clasificar el tipo de imagen. FFT calcula el contenido de frecuencia espacial de la imagen. Entonces, por ejemplo, la escena natural, la cara, la escena de la ciudad, etc. tendrán diferentes FFT. Por lo tanto, puede clasificar la imagen o incluso dentro de la imagen (por ejemplo, una fotografía aérea para clasificar el terreno).

Además, FFT se utiliza en el procesamiento previo para el reconocimiento de imágenes. Se puede usar para OCR (reconocimiento óptico de caracteres) para rotar la imagen escaneada en la orientación correcta. FFT de texto mecanografiado tiene una fuerte orientación. Lo mismo para la inspección de piezas en la automatización industrial.

+0

Pero no explicó por qué ** ** que puede ser utilizado para hacer tal cosa me – user198729

+0

estaba respondiendo ** cómo ** uno podría usar FFT. En cuanto a ** por qué **, dependería del problema. La FFT es computacionalmente costosa, por lo que la razón principal por la que uno la usaría es si el componente de frecuencia es una característica útil. – sjchoi

0

No creo que encuentre muchos métodos en uso que se basan en las transformadas de Fourier para el reconocimiento de imágenes.

En el caso del ruido de sal y pimienta, se puede considerar ruido de alta frecuencia y, por lo tanto, podría pasar de filtro bajo su FFT antes de hacer una comparación con la imagen de destino. Me imagino que funcionaría, pero que las imágenes diferentes que son algo similares (como las dos son fotografías tomadas en el exterior) se registrarían como la misma imagen.

+1

En realidad, hay muchas, muchas implementaciones de FFT para la coincidencia de imágenes en sistemas militares e industriales. Es EL algoritmo clásico para la coincidencia de imágenes. En estos días hay enfoques mucho más sofisticados, pero invariablemente son órdenes de magnitud más complejas. – Greg

+0

Veo que FFT se usa como una pequeña parte en el reconocimiento de imágenes. Pero sería muy curioso sobre cualquier sistema que tenga FFT como su forma principal de resolver el problema. Normalmente, el contenido de frecuencia de las fotografías es muy similar, independientemente de cuán similares sean visualmente las dos imágenes. Si tiene ejemplos de estas implementaciones, con gusto lo veré y revisaré mi vista si es necesario. –

+0

@kigurai - FFT es el núcleo de la correlación cruzada que se utiliza para la coincidencia de imagen/plantilla –

7

Actualícela para responder realmente a la pregunta que ha hecho ... :) Preprocesa la imagen con un filtro no lineal para suprimir el ruido de sal &. Median filtro tal vez?

lección básica sobre FFT en filtros adaptados sigue ...

La forma clásica de la detección de una imagen más pequeña dentro de una imagen más grande es el filtro emparejado . Esencialmente, esto implica hacer una correlación cruzada de la imagen más grande con la imagen más pequeña (lo que está tratando de reconocer).

  1. Para cada posición en la imagen más grande
  2. superposición de la imagen más pequeña en la imagen más grande
  3. Multiplicar todos los píxeles correspondientes
  4. sumar los resultados
  5. poner esa suma en esta posición en la imagen filtrada

El filtro combinado es óptimo cuando el único ruido en la imagen más grande es el ruido blanco.

Esto es computacionalmente lento, pero se puede descomponer en operaciones FFT (transformada rápida de Fourier), que son mucho más eficientes. Existen enfoques mucho más sofisticados para la coincidencia de imágenes que toleran otros tipos de ruido mucho mejor que el filtro combinado. Pero pocos son tan eficientes como el filtro combinado implementado usando FFT.

Google "coincide con el filtro", "correlación cruzada" y "filtro de convolución" para obtener más información.

Por ejemplo, aquí es una breve explicación de que también señala los inconvenientes de este enfoque muy oldschool coincidencia de imágenes: http://www.dspguide.com/ch24/6.htm

Cuestiones relacionadas