Voy a explicar esto de diferentes maneras porque me ayudó a entenderlo.
Tomemos un ejemplo específico. Estás haciendo una prueba de una enfermedad en un grupo de personas. Ahora definamos algunos términos. Para cada uno de los siguientes, me refiero a un individuo que ha sido probado:
Verdadero positivo (TP) : tiene la enfermedad, identificada como que tiene la enfermedad
Falso positivo (PF) : no tiene la enfermedad, identificada como que tiene la enfermedad
Verdadero negativo (TN) : no tiene la enfermedad, identificada como no enferma
Falso negativo (FN) : tiene la enfermedad, identificada como no enferma
Visualmente, esto se muestra típicamente usando la matriz de confusión :
La tasa de falsos positivos (FPR) es el número de personas que no tienen la enfermedad, pero se identifica que tienen la enfermedad (todos los PF), dividido por el número total de personas que no tienen la enfermedad (incluye todos los PF y TN) .
FPAGSR = FPAGSFPAGS+ Tnorte
La tasa de descubrimiento falso (FDR) es el número de personas que no tienen la enfermedad pero que se identifica que tienen la enfermedad (todos los PF), dividido por el número total de personas que se identifican que tienen la enfermedad (incluye todos los PF y TP) )
FD R =FPAGSFPAGS+TPAGS
Entonces, la diferencia está en el denominador, es decir, ¿con qué está comparando el número de falsos positivos?
El FPR le dice la proporción de todas las personas que no tienen la enfermedad que serán identificadas como portadoras de la enfermedad.
El FDR le está informando la proporción de todas las personas identificadas con la enfermedad que no la tienen.
Ambos son, por lo tanto, útiles, distintas medidas de falla. Dependiendo de la situación y las proporciones de TP, FP, TN y FN, puede que le importe más uno que el otro.
Ahora pongamos algunos números a esto. Ha medido 100 personas para la enfermedad y obtiene lo siguiente:
Verdaderos positivos (TP) : 12
Falsos positivos (PF) : 4
Verdaderos negativos (TN) : 76
Falsos negativos (FNs) : 8
Para mostrar esto usando la matriz de confusión:
Luego,
FPAGSR = FPAGSFPAGS+ Tnorte= 44 + 76= 480= 0.05 = 5 %
FD R = FPAGSFPAGS+ TPAGS= 44 + 12= 4dieciséis= 0.25 = 25 %
En otras palabras,
El FPR le dice que el 5% de las personas de personas que no tenían la enfermedad fueron identificadas con la enfermedad. El FDR le dice que el 25% de las personas que fueron identificadas con la enfermedad en realidad no la tenían.
EDITAR basado en el comentario de @ amoeba (también los números en el ejemplo anterior):
norte
[Nota al margen: Wikipedia señala que aunque el FPR es matemáticamente equivalente a la tasa de error de tipo I, se considera conceptualmente distinto porque uno generalmente se establece a priori mientras que el otro se usa típicamente para medir el rendimiento de una prueba posterior. Esto es importante pero no lo discutiré aquí].
Y para un poco más de integridad:
Obviamente, FPR y FDR no son las únicas métricas relevantes que puede calcular con las cuatro cantidades en la matriz de confusión. De las muchas métricas posibles que pueden ser útiles en diferentes contextos , dos que son relativamente comunes que es probable que encuentre son:
La Tasa Positiva Positiva (TPR) , también conocida como sensibilidad , es la proporción de personas que tienen la enfermedad que se identifican con la enfermedad.
TPAGSR = TPAGSTPAGS+ Fnorte
La Tasa Negativa Verdadera (TNR) , también conocida como especificidad , es la proporción de personas que no tienen la enfermedad que se identifican como que no la tienen.
TnorteR = TnorteTnorte+FPAGS