2010-04-04 18 views
6

Lamento preguntar esta amable pregunta de novato, pero porque realmente necesito una guía sobre cómo usar Multi probe LSH con bastante urgencia, así que no hice mucha investigación por mi cuenta. Me doy cuenta de que hay una llamada lib LSHKIT disponible que implementó ese algoritmo, pero tengo problemas para tratar de averiguar cómo usarlo. En este momento, tengo unas miles de características con una dimensión de vector 296, cada una representando una imagen. El vector se usa para consultar una imagen de entrada del usuario, para recuperar la imagen más similar. El método que utilicé para derivar la distancia entre vectores es la distancia euclidiana.Pregunta sobre multi-sondeo Local Sensible hashing

Sé que esto podría ser una pregunta más bien novato, pero ¿ustedes saben cómo debo implementar multi probe LSH? Estoy realmente muy agradecido con cualquier respuesta o respuesta.

- Actualización -

tratado de crear un modelo para mis datos con la herramienta proporcionada fitdata, sin embargo, no parece tomar en mi archivo. El formato que utilicé para la entrada está en este formato, tamaño de flotante: 4, número de datos: 20, dimensión: 297, y mi matriz de 297 dimenison float array. Sin embargo, me da este error

gsl: init_source.c:29: ERROR: matrix dimension n1 must be positive integer 
Default GSL error handler invoked. 
Aborted 

¿Tienen alguna idea de cómo crear una entrada para fitdata?

- Actualización -

Lo siento por la tarde al día, después de probar LSH. Puede usar text2bin para formatear los datos para fitdata. El archivo de texto contiene el vector de características de la imagen o archivo de audio, con cada fila representando un vector. Después de lo cual, use mplsh-tune para obtener el parámetro M y W. Para construir el índice, puede usar la herramienta de escaneo para muestrear un conjunto de consultas requeridas y puede usar mplsh-run para obtener el índice. Ahora estoy intentando descubrir cómo usar el índice y cómo vincular la biblioteca con mi codificación. ¿Algún cuerpo tiene alguna idea sobre esto?

Respuesta

6

Permítanme señalarlo en cambio a spectral hashing que patea el trasero de LSH a lo grande. Bonificación: Tienen el código matlab on their website, que puede usar o verificar contra su propia implementación. Además, es mucho más fácil de implementar.

+0

¡Gracias por la guía! Vería qué puedo hacer con él, porque realmente no sé matlab = x – Yijinsei

0

This implementation de Multi-probe LSH es mucho más fácil de usar que la biblioteca C++. También implementa LSH Forest.