2009-10-23 15 views

Respuesta

8

Microsoft históricamente ha utilizado una función de clasificación de red neuronal como su función de clasificación. La red neuronal combina los cientos de variables que una URL tendrá asociada con ella relacionada con la clasificación. Paper Por lo general, puntuarían más de 100 documentos utilizando un marcador detallado. Cada nodo de consulta deberá puntuar sus documentos superiores de forma aislada y devolverlos al agregador. La clasificación es en realidad muy compleja y los algoritmos de puntuación suelen tener varios niveles.

Para trabajos de cálculo, generación de factores, etc. ... Microsoft Search usa SCOPE que creo que está construido sobre Dryad pero no usa DryadLINQ. SCOPE es básicamente un lenguaje SQL en la parte superior de un clúster.

En realidad, Microsoft es mucho más abierto acerca de su tecnología en la búsqueda que Google. Microsoft Research Asia y Microsoft Research Silicon Valley

0

La información es de segunda mano, pero entiendo que usan índices invertidos (índices?) Para encontrar los 100 mejores resultados, y luego utilizan un conjunto de redes neuronales para limitarlo varias veces al top 10 , top 3, y luego para encontrar el primero.

Lo hacen porque razonan que el primer golpe es lo que hace que un usuario crea que el motor de búsqueda funciona o no. Si busca CNN y no obtiene CNN.com como primer intento, los usuarios piensan que el motor no funciona.

De nuevo, esto es conocimiento de segunda mano. Lo escuché de un amigo que trabajó en MS por un tiempo en su equipo de búsqueda.

+0

y map reduce no es realmente parte del algoritmo de "búsqueda". es solo una forma de descomponer un problema en partes paralelas. diciendo eso, probablemente usen algo similar. –

+0

estuvo de acuerdo en que no es el algoritmo que hace la búsqueda sino que lee los documentos de Google, el rango de la página (la columna vertebral de la calidad de los resultados de Google) utiliza este algoritmo, por lo que está relacionado con la búsqueda. –

Cuestiones relacionadas