La razón para definir el puntaje F-beta con es exactamente la cita que proporciona (es decir, querer adjuntar veces más importante para recordar que precisión) dada una definición particular de lo que significa adjuntar veces más importante para recordar que la precisión.β2ββ
La forma particular de definir la importancia relativa de las dos métricas que conduce a la formulación se puede encontrar en Recuperación de información (Van Rijsbergen, 1979):β2
Definición: La importancia relativa que un usuario otorga a la precisión y el recuerdo es la relación en la que , donde es la medida de efectividad basada en la precisión y el recuerdo.P/R∂E/∂R=∂E/∂PE=E(P,R)
La motivación para este ser:
La forma más simple que sé de cuantificar esto es especificar la relación a la que el usuario está dispuesto a cambiar un incremento de precisión por una pérdida igual en el recuerdo.P/R
Para ver que esto conduce a la de formulación que pueden comenzar con la fórmula general para la media armónica ponderada de y y calcular sus derivadas parciales con respecto a y . La fuente citó usos (para "medir la eficacia"), que está a sólo y la explicación es equivalente si consideramos o .β2PRPRE1−FEF
F=1(αP+1−αR)
∂F/∂P=α(αP+1−αR)2P2
∂F/∂R=1−α(αP+1−αR)2R2
Ahora, el establecimiento de los derivados iguales entre sí impone una restricción sobre la relación entre y la relación . Dado que deseamos asignar veces tanta importancia para recordar como precisión, consideraremos la relación 1 :αP/RβR/P
∂F/∂P=∂F/∂R→αP2=1−αR2→RP=1−αα−−−−−√
Definir como esta relación y reorganizar para da las ponderaciones en términos de :βαβ2
β=1−αα−−−−−√→β2=1−αα→β2+1=1α→α=1β2+1
1−α=1−1β2+1→β2β2+1
Obtenemos:
F=1(1β2+11P+β2β2+11R)
Que se puede reorganizar para dar el formulario en su pregunta.
Por lo tanto, dada la definición citada, si desea asignar veces tanta importancia para recordar como precisión, entonces debe usarse la formulación . Esta interpretación no se cumple si uno usa . La interpretación equivalente, menos intuitiva, en el caso de que solo usemos , sería que queremos adjuntar veces más importante para recordar que precisión.ββ2βββ−−√
Puede definir una puntuación como sugiere, sin embargo, debe tener en cuenta que, en este caso, la interpretación discutida ya no es válida o está implicando alguna otra definición para cuantificar el equilibrio entre precisión y recuperación.
Notas al pie:
- P/R se utiliza en la recuperación de información, pero esto parece ser un error tipográfico, ver La verdad de la medida F (Saski, 2007).
Referencias
- CJ Van Rijsbergen. 1979. Recuperación de información (2ª ed.), Pp.133-134
- Y. Sasaki. 2007. "La verdad de la medida F", enseñanza, materiales de tutoría