Dadas las tasas de verdadero positivo y falso negativo, ¿puede calcular falso positivo, verdadero negativo?

24

Tengo valores para True Positive (TP)y de la False Negative (FN)siguiente manera:

TP = 0.25
FN = 0.75

A partir de esos valores, ¿podemos calcular False Positive (FP)y True Negative (TN)?

roc confusion-matrix sensitivity-specificity

— Sencillez
fuente

53

Hay bastante confusión terminológica en esta área. Personalmente, siempre me parece útil volver a una matriz de confusión para pensar en esto. En una prueba de clasificación / detección, puede tener cuatro situaciones diferentes:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

En esta tabla, "verdadero positivo", "falso negativo", "falso positivo" y "verdadero negativo" son eventos (o su probabilidad). Por lo tanto, lo que tiene es probablemente una tasa positiva verdadera y una tasa negativa falsa . La distinción es importante porque enfatiza que ambos números tienen un numerador y un denominador.

Donde las cosas se vuelven un poco confusas es que puede encontrar varias definiciones de "tasa de falsos positivos" y "tasa de falsos negativos", con diferentes denominadores.

Por ejemplo, Wikipedia proporciona las siguientes definiciones (parecen bastante estándar):

Tasa positiva verdadera (o sensibilidad): $TPR = TP/(TP + FN)$
Tasa de falsos positivos: $FPR = FP/(FP + TN)$
Tasa negativa verdadera (o especificidad): $TNR = TN/(FP + TN)$

En todos los casos, el denominador es el total de la columna . Esto también da una pista a su interpretación: la verdadera tasa positiva es la probabilidad de que la prueba diga "A" cuando el valor real es de hecho A (es decir, es una probabilidad condicional, condicionada a que A sea verdadera). Esto no le dice qué tan probable es que esté en lo correcto al llamar "A" (es decir, la probabilidad de un verdadero positivo, condicionado a que el resultado de la prueba sea "A").

Suponiendo que la tasa de falsos negativos se define de la misma manera, tenemos (tenga en cuenta que sus números son consistentes con esto). Sin embargo, no podemos derivar directamente la tasa de falsos positivos de las tasas de verdadero positivo o falso negativo porque no proporcionan información sobre la especificidad, es decir, cómo se comporta la prueba cuando "no A" es la respuesta correcta. Por lo tanto, la respuesta a su pregunta sería "no, no es posible" porque no tiene información en la columna derecha de la matriz de confusión. $FNR = 1 - TPR$

Sin embargo, hay otras definiciones en la literatura. Por ejemplo, Fleiss ( métodos estadísticos para tasas y proporciones ) ofrece lo siguiente:

"[...] la tasa de falsos positivos [...] es la proporción de personas, entre las que respondieron positivas, que en realidad están libres de la enfermedad".
"La tasa de falsos negativos [...] es la proporción de personas, entre los que respondieron negativamente en la prueba, que sin embargo tienen la enfermedad".

(También reconoce las definiciones anteriores, pero las considera "un desperdicio de terminología preciosa", precisamente porque tienen una relación directa con la sensibilidad y la especificidad).

En referencia a la matriz de confusión, significa que y por lo que los denominadores son los totales de las filas . Es importante destacar que, según estas definiciones, las tasas de falsos positivos y falsos negativos no pueden derivarse directamente de la sensibilidad y especificidad de la prueba. También necesita saber la prevalencia (es decir, qué tan frecuente es A en la población de interés). $FPR = FP / (TP + FP)$ $FNR = FN / (TN + FN)$

Fleiss no utiliza ni define las frases "tasa negativa verdadera" o "tasa positiva verdadera", pero si asumimos que también son probabilidades condicionales dado un resultado / clasificación de prueba particular, entonces la respuesta @ guill11aume es la correcta.

En cualquier caso, debe tener cuidado con las definiciones porque no hay una respuesta indiscutible a su pregunta.

— Gala
fuente

44

Muy bien (+1). Inmediatamente salté a una interpretación, pero tienes toda la razón en que la definición alternativa es estándar.

— gui11aume

1

@ gui11aume. ¡Gracias! Era mi sentimiento, pero al pensarlo, ya no estoy tan seguro. En cuanto a las referencias, puede depender del campo (aprendizaje automático versus pruebas médicas).

— Gala

Mi experiencia es que la última definición, TPR = TP / (TP + FP), FPR = FP / (TP + FP) es más estándar.

— travelingbones

1

Aquí hay una publicación sobre las diferencias: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Tenga en cuenta la nueva terminología "Test FPR" vs. "Predictive FPR"

— travelingbones

8

EDITAR: vea la respuesta de Gaël Laurans, que es más precisa.

Si su verdadera tasa positiva es 0.25 significa que cada vez que llame a un positivo, tiene una probabilidad de 0.75 de estar equivocado. Esta es su tasa de falsos positivos. Del mismo modo, cada vez que llamas un negativo, tienes una probabilidad de 0,25 de tener razón, que es tu verdadera tasa negativa.

— gui11aume
fuente

Depende de lo que uno esté tratando de caracterizar: la prueba en el contexto de conocer la verdad de antemano, o tratar de decidir la probabilidad posterior a la prueba con los resultados disponibles.

— kd4ttc

3

Ninguno si esto tiene sentido si "positivo" y "negativo" no tienen sentido para el problema en cuestión. Veo muchos problemas donde "positivo" y "negativo" son elecciones forzadas arbitrarias en una variable ordinal o continua. FP, TP, sens, spec solo son útiles para fenómenos de todo o nada.

— Frank Harrell
fuente

-2

http://www.statsdirect.com/help/default.htm#clinical_epidemiology/screening_test.htm

1) Verdadero + ve y falso -ve hacen 100% 2) Falso + ve y verdadero -ve hacen 100% 3) No hay relación entre los verdaderos positivos y los falsos positivos.

— Sughosh
fuente