Estoy pensando en crear un sistema de base de datos para imágenes donde se almacenan con firmas compactas y luego comparar con una "imagen de consulta" que podría ser una versión redimensionada, recortada, iluminada, rotada o volteada de la almacenada. Tenga en cuenta que no estoy hablando de algoritmos de similitud de imagen, sino estrictamente sobre la detección de duplicados. Esto haría las cosas mucho más simples. Al sistema no le importaría si dos imágenes tienen un elefante, solo sería importante detectar si las dos imágenes son de hecho la misma imagen.¿Algoritmos de detección de imágenes duplicados?
Las comparaciones de histogramas simplemente no funcionarán para las imágenes de consulta recortadas. La única forma viable de ir es la detección de forma/borde. Primero, las imágenes se discretizarán de alguna manera, convirtiendo cada píxel a una escala de grises de 8 niveles, por ejemplo. La imagen discretizada contendrá amplias regiones del mismo color que ayudarían a indicar formas. Estas formas podrían describirse con coeficientes y su posición relativa podría ser recordada. Las firmas compactas se producirían a partir de eso. Este proceso se llevará a cabo sobre cada imagen que se almacena y sobre cada imagen de consulta cuando se tiene que realizar una comparación. ¿Eso suena como un algoritmo eficiente y realizable? Para ilustrar esta idea:
eliminado enlace ImageShack muertos
Sé que esto es un área de investigación inmaduro, He leído Wikipedia sobre el tema y le pediría a proponer sus ideas acerca de un algoritmo.
Usted dice que no estamos hablando de algoritmos de similitud, pero la detección de duplicados. Sin embargo, si también está hablando de permitir cambios, especialmente cultivos, inevitablemente tendrá que hacer un juicio sobre el grado de "similitud". –
Sin duda, habrá umbrales aceptables al hacer las comparaciones. La cuestión es que incluso una imagen de consulta recortada y de tamaño aún contiene un subconjunto de las mismas formas/áreas de interés, posicionadas relativamente de la misma manera, pero representadas con una cantidad diferente de píxeles. –