Conjuntos de datos de referencia para el filtrado colaborativo


9

Me gustaría probar un nuevo algoritmo para el filtrado colaborativo . Un caso de uso típico es recomendar películas basadas en las preferencias de los usuarios similares al usuario específico.

¿Cuáles son algunos conjuntos de datos de referencia comunes que los investigadores suelen utilizar para probar sus algoritmos? Sé que dentro de Computer Vision las personas a menudo usan MNIST o CIFAR, pero no he encontrado conjuntos de datos similares para el filtrado colaborativo.


1
¿Le echó un vistazo al conjunto de datos de premios de Netflix? Sí, la competencia terminó hace mucho tiempo y se retiró del sitio web oficial debido a algunas razones de privacidad. Todavía puede intentar encontrarlo en otros lugares.
Vladislavs Dovgalecs

Kaggle.com tiene un montón. Simplemente busque 'recomendación en: conjunto de datos' o 'recomendación en: competencia'.
ran8

Respuestas:


8

La respuesta obvia sería el conjunto de datos de premios de Netflix, hay mucha investigación al respecto y la mayoría de los algoritmos de FQ tienen puntajes conocidos.

Hay otros conjuntos de datos disponibles que generalmente se usan como puntos de referencia:


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.