Actualmente estoy investigando sistemas de recomendación y me gustaría saber cómo otros investigadores adquieren o generan datos de prueba para evaluar el rendimiento de los sistemas.Cómo adquirir o generar datos de prueba para un sistema de recomendación
Respuesta
No sé qué campo está evaluando, pero si se trata de recomendaciones de películas, puede usar el MovieLens data de GroupLens para comenzar. (Parece que su sitio está temporalmente fuera de servicio, pero estoy seguro de que volverá pronto).
Tienen tres conjuntos de datos: 100.000 votos (preferencias), 1 millón y 10 millones, y parece que son más o menos el estándar con el que todo el mundo comienza.
Cuando estaba trabajando con Recommender Systems tuve exactamente el mismo problema. Disfruté de las Grouplens el conjunto de datos más:
Puede descargar las calificaciones dadas por los usuarios a las películas.
Además, he descrito en mi blog algunos conjuntos de datos que encontré mientras investigaba:
http://girlincomputerscience.blogspot.com.br/2010/12/datasets.html
espero que ayude!
- 1. Generar datos de prueba de un REGEX
- 2. Sistema de recomendación de página web
- 3. Cómo generar datos de prueba para un algoritmo "agrupar por datos de otras filas"
- 4. ¿Cómo construir un sistema de recomendación de películas?
- 5. Marcos de prueba de integración para probar un sistema distribuido?
- 6. Creación de un filtro colaborativo/Sistema de recomendación
- 7. ¿Cómo puedo implementar un motor de recomendación?
- 8. ¿Cómo diseñar una prueba unitaria para generar un documento PDF?
- 9. Generar datos aleatorios de prueba de SQL Server 2008
- 10. Recomendación para Java VM ejecutándose en el sistema integrado
- 11. ¿Es una mala práctica generar aleatoriamente datos de prueba?
- 12. Base de datos para un sistema integrado
- 13. Filtrado basado en el usuario: sistema de recomendación
- 14. ¿Alguna recomendación para estructuras de datos profundas con Backbone?
- 15. Recomendación sobre herramientas para migrar de Clearcase a SVN?
- 16. Cómo adquirir un candado con una llave
- 17. ¿Recomendación de CakePHP para iterar una tabla enorme y generar un mapa del sitio?
- 18. Recomendación para una base de datos en memoria
- 19. ¿Conoces un generador de datos de prueba gratuito para la base de datos mysql?
- 20. ¿Cómo generar datos geoJson?
- 21. Algoritmo del motor de recomendación básica
- 22. Sistema de recomendación: simple filtrado colaborativo basado en el usuario para evaluar con precisión y recuperación
- 23. cómo adquirir la lista de íconos del área de notificación?
- 24. Prueba de base de datos en Android: ProviderTestCase2 o RenamingDelegatingContext?
- 25. Análisis en C++ para generar resúmenes de prueba de unidades
- 26. Cómo generar una ruta independiente de sistema operativo en C++
- 27. Almacenamiento de imágenes: Sistema de base de datos o archivos -
- 28. Algoritmo de recomendación
- 29. JSONP para adquirir JSON De protocolo HTTPS con jQuery
- 30. Prueba de sistema operativo en tiempo real para dureza
¡Impresionante! Gracias por la info. ¿Qué pasaría si las personas buscaran un conjunto de datos basado en elementos en lugar de basados en calificaciones? P.EJ. Filtrado colaborativo vs filtrado de contenido/filtrado de elementos/recuperación de información. – user1260160
¿Qué quieres decir? El conjunto de Grouplens se puede usar también para el filtrado colaborativo. – Eyal