¿Cómo crear un sistema de recomendación que integre tanto el filtrado colaborativo como las características de contenido?


10

Estoy creando un sistema de recomendación y quiero incorporar tanto las calificaciones de los usuarios "similares" como las características de los elementos. La salida es una calificación prevista [0-1]. Estoy considerando una red neuronal (para empezar).

Por lo tanto, las entradas son una combinación de las características de los elementos y las calificaciones de cada usuario. Para el ítem A y el usuario 1, el sistema podría recibir capacitación sobre los datos combinados, A1. Este sería un ejemplo de entrenamiento.

¿Qué pasa si el usuario 1 también calificó la película B? Entonces, ¿los datos B1 también serían un ejemplo de entrenamiento? ¿Hay algún problema al repetir el entrenamiento con las funciones del usuario 1 de esta manera?

¿Tiene alguna sugerencia sobre una mejor manera de abordar el problema?

Respuestas:


11

¿Por qué está considerando una red neuronal antes de comprender completamente el problema?

Los métodos estándar de factorización matricial para el filtrado colaborativo pueden aprovechar las características del contenido fácilmente. Para ver un ejemplo de cómo se puede hacer esto en un entorno bayesiano, consulte el documento Matchbox .


6

Tres documentos sobre la integración de la factorización matricial con características de contenido (aquí, modelo de tema específicamente):

  • Deepak Agarwal y Bee-Chung Chen. 2010. fLDA: factorización matricial mediante asignación de dirichlet latente. En Actas de la tercera conferencia internacional de ACM sobre búsqueda web y minería de datos (WSDM '10). ACM, Nueva York, NY, EE. UU., 91-100.
  • Hanhuai Shan y Arindam Banerjee. 2010. Factorizaciones de matriz probabilística generalizadas para el filtrado colaborativo. En Actas de la Conferencia Internacional IEEE 2010 sobre Minería de Datos (ICDM '10). IEEE Computer Society, Washington, DC, EE. UU., 1025-1030.
  • Chong Wang y David M. Blei. 2011. Modelado de temas colaborativos para recomendar artículos científicos. En Actas de la 17ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos (KDD '11). ACM, Nueva York, NY, EE. UU., 448-456.

También promocionaría mi propia entrada de blog que analiza un poco este tema: los modelos de temas se encuentran con los modelos de factor de lantent


3

No hay necesidad de un enfoque de red neuronal, el filtrado colaborativo es un algoritmo en sí mismo. Para su problema específicamente, hay una buena descripción del sistema cf y recomender en:

ml-class.org

(busque XVI: Sistemas de recomendación). Es elegante, simple, y si lo haces bien (es decir, usa forma vectorizada, minimizadores rápidos y gradientes preparados) puede ser bastante rápido.


Usé ese enfoque, pero no usa las características de los elementos. Me gustaría incluir características también.
B Seven
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.