2008-09-27 6 views
10

¿Qué algoritmo usa Twitter para determinar los 10 temas que puede ver en search.twitter.com? Me gustaría implementar ese algoritmo y también me gustaría mostrar los 50 temas más populares (en lugar de 10). ¿Puedes describir el algoritmo más eficiente?¿Cuál es el algoritmo de "trending topics" de search.twitter.com?

Gracias!

(Twitters API se puede encontrar en- http://apiwiki.twitter.com/REST%20API%20Documentation)

Además, me gustaría ser capaz de implementar el algoritmo de búsqueda a través de la timeline- pública http://twitter.com/statuses/public_timeline.rss

Respuesta

1

Entonces, ¿qué Twitter probablemente hace es que cuenta el número de menciones de un término particular menos palabras de tope (palabras para detenerse como: do, me, you, I, not, on, etc.) Así que "el gato está fuera de la bolsa" y "mi perro se comió mi gato" significaría ese gato, perro y bolsa serían los términos que extrajo (el resto son palabras para detener) Y luego cuenta 'gato' como 2 referencias, por lo que 'gato' sería un tema de tendencia en este caso.

12

El algoritmo de tendencia de Twitter no es solo el volumen de palabras clave. Eso es parte de esto, pero también hay un factor de deterioro para que "justin beiber" no sea la mejor tendencia para siempre.

Esta publicación en quora respalda esto. http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

decaimiento se suele hacer mediante el uso de la edad relativa de la publicación en el algoritmo, dando más peso a los nuevos temas/publicaciones/etc.

ver también http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm

Cuestiones relacionadas