Estoy tratando de diseñar una técnica de factorización matricial para un simple sistema de recomendación de calificación de elementos de usuario. Tengo 2 preguntas sobre esto.
Primero, en una implementación simple que vi de la técnica de factorización matricial para la recomendación de películas, el autor acaba de inicializar las dimensiones de las características latentes, llamémoslas K de las dos matrices de Usuario y Elemento de características latentes, a algunas K constantes, digamos 2 y, por lo tanto, cada de sus matrices de características latentes P y Q fueron NXK y MXK, donde R es la matriz de calificación de elementos de usuario original que estamos tratando de aproximar con dimensiones NXM (N usuarios y elementos M). Entonces, mi pregunta es ¿cómo puedo determinar la 'K' óptima (número de características latentes) en este caso en lugar de establecerla en una constante?
También hay alguna forma de incorporar información de usuario o elemento que ya tengo en mi conjunto de datos, como la calificación promedio de un usuario en particular, el sexo del usuario, la ubicación del usuario, etc. en este resultado de la factorización de la matriz al hacer mi recomendación final (supongo ¿tal vez funcionaría un modelo de combinación con la información del usuario y del elemento representada en algún otro modelo de filtrado basado en contenido junto con mi modelo de factorización matricial?).
1> Mi primera pregunta es cómo determinar el número óptimo de características latentes. K 2> ¿alguien sabe de literatura reciente que implemente un modelo combinado de factorización matricial y filtrado basado en contenido (porque supongo que esa sería la única forma de representar información demográfica de usuarios y elementos en un espacio de características comunes).