7
  • ¿Cuál es el mejor enfoque?
  • ¿Cuáles son los algoritmos utilizados? Cuales son sus fortalezas y debilidades?
  • ¿Por qué los sistemas actuales de recomendación de películas fallan al proporcionar buenas recomendaciones?
+0

probablemente [webmasters.stackexchange.com] (http://webmasters.stackexchange.com) es el mejor lugar para esta respuesta –

+0

¿Puedo saber por qué? – melhosseiny

+0

"¿Por qué chupan la mayoría de los sistemas de recomendación de películas?" no suena como una pregunta de programación. tal vez no estoy en lo cierto sobre webmasters.stackexchange.com –

Respuesta

7

Esta es una pregunta muy abierta que implica una gran cantidad de conceptos diferentes.

Como punto de discusión inicial, considere el k-nearest neighbor algorithm. Es ampliamente utilizado en problemas similares a su selector de películas. Un gran problema con este algoritmo es el aporte humano al decidir cuántas dimensiones usa para segmentar su espacio de características y elegir las propiedades de cada una de esas dimensiones para que cada una agregue valor, en lugar de duplicar el valor de otra dimensión.

Directamente relacionado con el algoritmo k-NN es el campo cluster analysis. Cuando traza los puntos de datos para la información que tiene agrupamientos dentro de valores atípicos más dispersos, puede ver intuitivamente que existe cierta naturaleza de similitud en los puntos agrupados. Es posible que pueda agrupar fácilmente a algunos de los valores atípicos dispersos con uno u otro grupo, pero habrá muchos puntos que se encuentran entre grupos que podrían encajar con dos o más grupos competitivos. La única forma de remediar este dilema es agregar más parámetros dimensionales a sus puntos de datos para que esos valores atípicos no comprometidos se dibujen en un grupo. (Siga el enlace para ver una buena imagen de datos agrupados.)

Esta breve introducción conduce al siguiente concepto: Pattern Recognition. Esta asignatura es matemática pesada y el tema de mucha investigación en los campos de la ciencia de la computación teórica, estadística, inteligencia artificial, aprendizaje automático y clarividencia. El último es un semi-chiste, pero apunta al quid de su problema: ¿Cómo puede una computadora predecir lo que hará en el futuro? La respuesta corta es que no puede. La respuesta más larga intenta explicar por qué sus gustos y estados de ánimo cambian en direcciones aparentemente aleatorias en momentos aparentemente aleatorios.Un buen sistema de reconocimiento de patrones puede elegir 20 películas que realmente disfrute y luego recomendar otra del mismo grupo que las otras 20 que odia. ¿Dónde falló el sistema? Fue en la implementación del algoritmo, la selección inicial de parámetros para las dimensiones de su espacio de características, o su perfil se ensució porque otra persona usó su cuenta de Netflix para ordenar 'Howard the Duck', 'Crucero' y 'Playas'?

La página de wikipedia para 'Reconocimiento de patrones' enumera una gran cantidad de algoritmos y métodos diferentes. Puede comenzar a leer allí para obtener un mejor manejo de las fortalezas y debilidades individuales. También puedes intentar hacer esta pregunta en la pila Theoretical Computer Science para obtener las respuestas de pelo largo.

2

Un equipo de BellKor ganó el Netflix Prize. Entonces, podría decirse que este enfoque puede ser el mejor enfoque.

Para dar una explicación intuitiva de alto nivel de cómo funcionan estos sistemas de recomendación, tenga en cuenta la siguiente situación. Veo Star Wars dos veces por semana. Ahora, si tuvieras que recomendarme una película que me gustaría, ¿qué película elegirías? Una película con Harrison Ford? Una película de ciencia ficción? Tal vez una película hecha en los años 80?

La gran idea detrás de los sistemas de recomendación es que cuanto más saben lo que les gusta (es decir, qué géneros, actores, etc.), mejores recomendaciones pueden dar.

Sin embargo, si tus gustos se contradicen entre sí (por ejemplo, te encanta Salvar al soldado Ryan, pero también te encantan las películas sobre pacifistas), será difícil recomendarte una película.

En resumen, muchos algoritmos de recomendación necesitan saber:

  1. Lo que te gusta: se trata de saber qué conjunto de características para su uso en la grabación de películas lo que te gusta. P.ej. cuál es el género de la película, qué actores están en la película, etc.
  2. Qué películas son similares a las que te gustan. Esto implica encontrar una buena métrica de similitud basada en el conjunto de características que usa en el paso anterior.
Cuestiones relacionadas