Máquinas de factorización de campo


Respuestas:


2

Parece que estás pidiendo una descripción de alto nivel. Si hace referencia a las diapositivas vinculadas dentro de las diapositivas de su publicación original, hay una comparación de FM (diapositiva 11) frente a FFM (diapositiva 12).

Como ejemplo rápido, si está aprendiendo sobre usuarios y películas, FM podría tener el siguiente factor:

w_{user_1}*w_{movie_1}*... + w{user_1}*w_{genre_1}*...

FFM tendría:

w_{user_1, movies}*w_{movie_1, users}*... + w{user_1, genres}*w_{genre_1, users}*...

La diferencia clave es que en FM, el w_{user_1}coeficiente es el mismo en ambos términos: hay una sola noción del usuario. En FFM, se aprende una forma separada w_{user_1}para cada contexto, por ejemplo, si se trata de interactuar con películas o géneros. Tenga en cuenta que no se aprende por separado para cada película o género en particular, sino para películas y géneros en general. Es decir, aprende por separado el contexto del usuario para cada tipo de interacción.

También tenga en cuenta que w_{movie_1}fue w_{movie_1, users}ya que ese término está interactuando con w_{user_1}un usuario.


2

Suponga que (antes de la codificación en caliente) tiene predictores / campos de un conjunto (por ejemplo, género de película, género de usuario y raza de usuario). Supongamos además que cada predictor puede tomar uno de los valores de . Después de la codificación de un solo uso, tendrá un nuevo conjunto de características binarias de tamaño .ZzZkzXK:=zZkz

En un modelo con todas las interacciones, debe estimar una matriz de coeficientes de interacción , que tiene términos únicos.QK×(K+1)/2

La máquina de factorización coloca la estructura en la matriz y supone que , donde es de dimensión , con algún número especificado por el usuario. Estimamos en lugar de .QQWTWWl×K1lKWQ

La máquina de factorización con reconocimiento de campo también pone estructura enDivide en bloques basados ​​en (las características originales). Si denota el bloque de , suponemos que proviene de la bloque de , donde es de dimensión . Al igual que con la FM, se estima la en lugar de .QQzqzi,zjzi,zjQqzi,zjzi,zjWjTWiWil×KWiQ

La factorización FM de tiene parámetros . El FM "feild-aware" tieneparámetros Un modelo con todas las interacciones tiene parámetros . QK×lK×l×|Z|K×(K+1)/2


1

Las máquinas de factorización estándar también tienen campos. La "novedad" aquí parece ser el uso de funciones GBDT y la aplicación de los trucos de hashing. Parece que no tiene un gran efecto: mira el rango de minutos en el rendimiento en la última diapositiva.


Según los autores, hay una característica de campo consciente del modelo, en relación con la implementación estándar: se afirma en los foros de kaggle. Simplemente no pude entender lo que significaba y cuál era la diferencia en realidad.
B_Miner


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.