En el filtrado colaborativo, tenemos valores que no se completan. Supongamos que un usuario no vio una película, entonces tenemos que poner una 'na' allí.
Si voy a tomar un SVD de esta matriz, entonces tengo que poner algún número allí, digamos 0. Ahora, si factorizo la matriz, tengo un método para encontrar usuarios similares (descubriendo qué usuarios están más cerca en El espacio dimensional reducido). Pero la preferencia predicha en sí misma: para un usuario a un elemento será cero. (porque eso es lo que ingresamos en las columnas desconocidas).
Así que estoy atrapado con el problema del filtrado colaborativo vs SVD. Parecen ser casi lo mismo, pero no del todo.
¿Cuál es la diferencia entre ellos y qué sucede cuando aplico una SVD a un problema de filtrado colaborativo? Lo hice, y los resultados parecen aceptables en términos de encontrar usuarios cercanos, lo cual es genial, pero ¿cómo?