He examinado Moodstocks, que parece haber perfeccionado un sistema de reconocimiento de imágenes con un servicio de pago por mes. Tienen un gran sistema (lo he probado para mi propio uso y es fantástico) PERO es EXTREMADAMENTE costoso para mí, y es por eso que no lo estoy usando.En el momento en que escribo esto, el servicio de imágenes "hasta 100,000" es de aproximadamente $ 12,000/año. Para mi proyecto, tengo casi 4 millones de imágenes con las que necesito comparar. YIKES.
Así que después de muchos meses de investigación, he llegado a la conclusión de que si comparas miles de imágenes o más (en mi caso más de 1 millón), tendrás que hacer la comparación de imagen de del dispositivo. Los dispositivos móviles de los usuarios no tienen el espacio, la velocidad y la potencia para realizar grandes cantidades de cálculos para realizar este tipo de trabajo.
Lo que realmente significa es que necesita configurar un servidor de reconocimiento de imágenes en una máquina de alto rendimiento y hacerlo público para su aplicación. En la aplicación, haga que el usuario tome una fotografía de un objeto (o puede tomar fotogramas del video de la cámara), llévela a su servidor para compararla y luego, cuando encuentre una coincidencia, informe los resultados a la aplicación.
Puede usar un marco como Accord.NET o EmguCV para hacer una aplicación de escritorio C o un servicio que se ejecute en un cuadro de servidor de Windows para hacer esto, por ejemplo.
Lo que la aplicación Amazon iOS hace para el reconocimiento de imágenes por lo que puedo adivinar es que parecen localizar los puntos SURF en tiempo real y los envía al servidor mientras escanea en lugar de toda la imagen. Supongo que usan OpenCV en el dispositivo para hacer esto. Pero aún usan el software del servidor para devolver el SKU del producto coincidente.
Aquí hay una publicación impresionante del blog por un chico que quería hacer una coincidencia de imágenes en .NET y él repasa cada paso incluyendo cómo funciona, cómo hacerlo y luego da todo su código en una aplicación de muestra. Increíble publicación: https://sbrakl.wordpress.com/2015/01/30/love-affair-with-cbir-part-3/comment-page-1/
De lo que he podido aprender es que el algoritmo LoCATe realiza el mejor y el más rápido con grandes cantidades de imágenes, pero también lleva horas, días y posiblemente semanas (dependiendo de la cantidad de imágenes tienes) para crear índices masivos para la búsqueda. Creo que cuando se trata de la coincidencia de imágenes, he encontrado que la velocidad de creación de un índice sólido está relacionada con la velocidad de búsqueda de coincidencias de las consultas.
posible duplicado de [Reconocimiento de imagen muy simple en iOS] (http://stackoverflow.com/questions/4695268/very-simple-image-recognition-on-ios) –