Se puede encontrar un buen enfoque para este tipo de problema en la sección 4 del artículo El sistema de recuperación de imágenes bayesianas, PicHunter por Cox et al (2000). Los datos son un conjunto de resultados enteros.UNA1, . . . ,UNAnorte dónde nortees el número de pruebas En su caso, hay 3 resultados posibles por ensayo. PermitiréUNAyoser el índice de la cara que quedó fuera. La idea es postular un modelo generativo para el resultado dados algunos parámetros del modelo, y luego estimar los parámetros por máxima verosimilitud. Si mostramos caras(X1,X2,X3) y el participante dice que (X2,X3) son los más similares, entonces el resultado es A = 1, con probabilidad
p ( A = 1 | X1,X2,X3) ∝ exp( - d(X2,X3) / σ)
dónde
re(X2,X3) es la distancia entre las caras 2 y 3, y
σes un parámetro para la cantidad de "ruido" (es decir, qué tan consistentes son los participantes). Como desea una incrustación en el espacio euclidiano, su medida de distancia sería:
re( x , y) =∑k(θx k-θyk)2------------√
dónde
θX es la incrustación (desconocida) de la cara
X. Los parámetros de este modelo son
θ y
σ, que puede estimar a partir de los datos a través de la máxima probabilidad. El papel usó el gradiente de ascenso para encontrar el máximo.
El modelo en el documento era ligeramente diferente ya que el documento utilizaba atributos conocidos de las imágenes para calcular la distancia, en lugar de una incrustación desconocida. Para aprender una incrustación, necesitaría un conjunto de datos mucho más grande, en el que cada cara se mostrara varias veces.
Este modelo básico supone que todos los ensayos son independientes y todos los participantes son iguales. Un buen beneficio de este enfoque es que puede embellecer fácilmente el modelo para incluir la no independencia, los efectos de los participantes u otras covariables.