2009-10-20 21 views
7

Me gustaría jugar con la construcción de un sistema de recomendaciones, y me refiero a un algoritmo que analiza las preferencias y/o revisiones publicadas por un usuario y luego hace recomendaciones para ellas, de forma similar a lo que usa Netflix o Amazon.¿Dónde puedo obtener información sobre los sistemas de recomendación?

¿Cuáles son algunos buenos recursos para aprender a escribir algo como esto? ¿Donde debería empezar?

Respuesta

5

Echa un vistazo a la página de Wikipedia en el Netflix Prize y es discussion forum. Además, el 2009 GitHub Contest algo relacionado es una buena fuente para el código fuente completo en una serie de diferentes motores de recomendación. Y obviamente también está el Wikipedia page on the topic itself, que tiene algunos enlaces decentes.

Si comienza a escribir el suyo, querrá usar un corpus. De hecho, recomendaría usar el Netflix Prize's data set. Simplemente esculpe el conjunto de datos en dos partes. Entrena en la primera pieza y puntúa tu algoritmo en la segunda pieza.

Adenda: Una aplicación de alguna manera relacionado y aterrador de este tipo de cosas es predicting demographic information: sexo, edad, ingresos del hogar, IQ, la orientación sexual de un usuario, etc. Probablemente se podría hacer la mayor parte de estos atributos con el Premio Netflix conjunto de datos con un alto grado de precisión. Afortunadamente everyone in that dataset is just a number.

+0

¿Qué tiene de terror eso? Los profesionales del marketing intentan predecirlo todo el tiempo en función de su navegador, IP y otra información del encabezado HTTP. No es información real, solo "estereotipos informados" (Bayes condicional). – isomorphismes

+1

Porque los datos se representaron como "anónimos" pero en realidad no? Esto es particularmente malo si el usuario nunca optó por compartir sus datos. –

+0

Puede que no entienda exactamente lo que quieres decir. ¿Estás diciendo que se violó el anonimato porque puedo adivinar con precisión las características demográficas del usuario 2871875? – isomorphismes

3

Eche un vistazo a pysuggest una biblioteca de Python que implementa una variedad de algoritmos de recomendación para collaborative filtering (que es utilizado por Amazon.com).

Cuestiones relacionadas