Poder del experimento de té degustación de dama

9

En el famoso experimento de Fisher la observable es el número de corregido taza adivinado que tiene dos tipos de taza y . Por lo general, es interesante calcular la región crítica para rechazar la hipótesis nula (la mujer adivina al azar) dado el tamaño de la prueba . Esto se hace fácilmente usando la distribución hipergeométrica. De la misma manera puedo calcular el tamaño de la prueba dada la región crítica. $k$ $A$ $B$ $\alpha$

Una pregunta diferente es: ¿cómo calcular el poder de la prueba, dada una hipótesis alternativa? Supongamos, por ejemplo, que la mujer es capaz de adivinar correctamente con probabilidad en la taza individual ( ). ¿Cuál es el poder de la prueba, suponiendo un número total de tazas igual a y un número total de tazas de un tipo $p=90\%$ $P(\text{guess} A|\text{true} A)=P(\text{guess } B|\text{true } B)=0.9$ $N=8$ $n=N/2=4$ ? (Desafortunadamente) la dama sabe . $n$

Dicho en otras palabras: ¿cuál es la distribución de (número de tazas correctas bajo la hipótesis alternativa) si la dama sabe que hay tazas de un tipo? $k=$ $n$

hypothesis-testing power fishers-exact

— Ruggero Turra
fuente

Pensando en tu publicación ... Si Fisher decidió rechazar el nulo solo si la dama tenía razón en todas sus suposiciones (creo que ese fue el caso), y solo hay una forma posible de acertar todas las tazas, no debería la probabilidad de que esto ocurra sea

sea la potencia real?

{0.9}^{4} = 0.6561

$0.9^4=0.6561$

— Antoni Parellada

No rechazas cuando adivina todas las tazas en general. Pero es cierto que con

esa es la región crítica. No tienes en cuenta que la mujer sabe que hay 4 tazas de cada tipo. Por cierto estoy interesado en la solución general

N = 8

$N=8$

N \neq 8

$N\neq 8$

— Ruggero Turra

1

Este es un problema interesante pero difícil. Es fácil determinar las tablas que llevarían a rechazar Ho, pero tendrían que pensar en la probabilidad de ver esas tablas bajo Ha. El siguiente artículo calcula el poder para una tabla ligeramente modificada con una sensibilidad y especificidad determinadas: "Una generalización del procedimiento Lady-Tasting-Tea para vincular enfoques cualitativos y cuantitativos en la investigación psiquiátrica" por Falissard et al. No estoy seguro si los cálculos son correctos. Si realmente tiene un problema binomial, puede usar el paquete Exact R, pero este es un problema diferente

— Peter Calhoun el

3

Bajo la alternativa, la dama no está adivinando al azar, pero "no adivina al azar" cubre una infinidad de situaciones diferentes. Es posible que siempre adivine perfectamente o que lo haga solo un poco mejor que las suposiciones aleatorias ... y, en el caso general, ni siquiera hay una "escala" de variable única que no sea aleatoria para trabajar (por lo que ni siquiera tenemos un poder curva a menos que restrinjamos los tipos de respuestas no aleatorias que podría dar).

Entonces, para calcular una potencia, debemos ser muy específicos acerca de cómo no es aleatorio (y qué tan no aleatorio es de esa manera particular).

Podríamos suponer, por ejemplo, que tiene una sensación de cuánto sabe cada taza a la leche que se agregó primero: un índice de "primicia de la leche" que es una variable aleatoria en que tiene un valor diferente ( mayor) significa cuando la leche se agrega primero, por ejemplo, podríamos suponer que es normal o logoístico, con media y varianza ( se conoce como "precisión") cuando la leche se agrega por última vez y media y varianza $(-\infty,\infty)$ $\mu_0$ $\sigma^2=1/\omega^2$ $\omega^2$ $\mu_1$ $\sigma^2$ cuando se agrega leche primero (de hecho, una presunción más simple pero más restrictiva podría ser establecer, por ejemplo, para que ahora todo sea función de una variable, la precisión). Entonces, para cualquier valor dado de esos parámetros, podríamos calcular la probabilidad de que ella obtenga las 8 tazas correctas (que los cuatro valores más pequeños de "primicia de la leche" que experimenta estén asociados con las cuatro tazas de la segunda leche); Si el cálculo exacto fuera demasiado difícil para nosotros, podríamos simularlo con la precisión deseada. [En el caso de que se presuma que la no aleatoriedad es función de una sola variable, tendríamos una curva de potencia, un valor de potencia para cada valor del parámetro]. $\mu_1=-\mu_0=1$

Ese es un tipo específico de modelo de cómo podría funcionar "mejor que al azar" con el que podríamos especificar parámetros y obtener un valor de potencia.

Por supuesto, podríamos suponer muchas otras formas de no aleatoriedad que esta.

— Glen_b -Reinstate a Monica
fuente

3

La distribución del número correcto de conjeturas bajo la hipótesis alternativa sigue una distribución hipergeométrica no central , que se parametriza en términos de la razón de probabilidades, es decir, cuánto más altas son las probabilidades de que la mujer adivine "té primero" cuando está en De hecho, el té realmente se agregó primero en lugar de cuando en realidad se agregó primero la leche (o al revés). Si la razón de posibilidades es 1, obtenemos la distribución hipergeométrica central.

Vamos a ver si esto funciona. Usaré R con fines ilustrativos, usando el MCMCpackpaquete, que tiene la función dnoncenhypergeom()de calcular la densidad de una distribución hipergeométrica (no central). Tiene argumentos xpara el número correcto de conjeturas (cuidado: este es el número correcto de conjeturas debajo de una de las dos condiciones, por ejemplo, cuando el té se sumó primero), argumentos n1, n2y m1para tres de los cuatro márgenes, y psipara La verdadera razón de posibilidades. Calculemos la densidad xigual a 0 a 4 (con todos los márgenes iguales a 4) cuando la razón de probabilidad real es 1:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

Esto produce:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

Por lo tanto, existe una probabilidad del 1,43% de que la mujer haga 8 conjeturas correctas (es decir, adivine las 4 tazas correctamente donde se agregó el té primero y, por lo tanto, también adivina correctamente las 4 tazas donde se agregó la leche primero) bajo la hipótesis nula. De hecho, esta es la cantidad de evidencia que Fisher consideró suficiente para rechazar la hipótesis nula.

$(.90/(1-.90)) / (.10/(1-.10)) = 81$ $\text{odds}(\text{guess}A|\text{true}A) / \text{odds}(\text{guess}A|\text{true}B)$ ) ¿Cuáles son las posibilidades ahora de que la mujer adivine las 8 tazas correctamente (es decir, adivine las 4 tazas correctamente donde se agregó el té primero y, por lo tanto, también las 4 tazas correctamente donde se agregó la leche primero)?

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

Esto produce:

[1] 0.8312221

Entonces, el poder es aproximadamente del 83%.

— Wolfgang
fuente