¿Cuál es el estadístico de prueba en la prueba exacta de Fisher?


9

Para una tabla de 2 por 2 contingencia, algunos dijeron la prueba exacta de Fisher utiliza el recuento de en el (1,1) de células en la tabla como la estadística de prueba, y bajo hipótesis nula, voluntad tener una distribución hipergeométricaX1,1X1,1

Algunos dijeron que su estadística de prueba es donde es la media de la distribución hipergeométrica (mencionada anteriormente) bajo nulo. También dijo que los valores p se determinan en función de la tabla de distribución hipergométrica. Me preguntaba si hay alguna razón para restar la media y luego tomar el valor absoluto. no tiene una distribución hipergeométrica bajo nulo, ¿verdad?mu | X 1 , 1 - μ |

|X1,1μ|
μ|X1,1μ|

Respuestas:


10

(Para que nuestras nociones sean un poco más precisas, llamemos al 'estadístico de prueba' la distribución de lo que buscamos para calcular realmente el valor p. Esto significa que para una prueba t de dos colas, nuestro estadístico de prueba sería lugar de )|T|T

Lo que es una prueba estadística que hace es inducir un ordenamiento en el espacio muestral (o más estrictamente, una ordenación parcial), de manera que pueda identificar los casos extremos (los más consistentes con la alternativa).

En el caso de la prueba exacta de Fisher, ya hay un orden en cierto sentido, que son las probabilidades de las distintas tablas de 2x2. Si llega el caso, que se corresponden con el pedido de en el sentido de que cualquiera de los valores más grandes o más pequeñas de son 'extremo' y son también los que tienen menor probabilidad. Entonces, en lugar de mirar los valores de en la forma que sugieres, uno simplemente puede trabajar desde los extremos grande y pequeño, en cada paso simplemente agregando el valor (el mayor o menorX1,1X1,1 X 1 , 1 X 1 , 1X1,1X1,1-valor aún no está allí) tiene la menor probabilidad asociada con él, continuando hasta llegar a la tabla observada; en su inclusión, la probabilidad total de todas esas tablas extremas es el valor p.

Aquí hay un ejemplo:

función de probabilidad hipergeométrica

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

La primera columna son valores , la segunda columna son las probabilidades y la tercera columna es el orden inducido.X1,1

Entonces, en el caso particular de la prueba exacta de Fisher, la probabilidad de cada tabla (equivalentemente, de cada valor ) puede considerarse el estadístico de prueba realX1,1 .

Si compara la estadística de prueba sugerida, induce el mismo orden en este caso (y creo que lo hace en general, pero no lo he verificado), ya que los valores más grandes de esa estadística son los valores más pequeños de la probabilidad, por lo que también podría considerarse 'la estadística' - pero también podrían hacerlo muchas otras cantidades; de hecho, cualquiera que conserve este orden de las s en todos los casos son estadísticas de prueba equivalentes, porque siempre producen valores p idénticos.|X1,1μ|X 1 , 1X1,1

También tenga en cuenta que con la noción más precisa de 'estadística de prueba' introducida al principio, ninguna de las estadísticas de prueba posibles para este problema tiene una distribución hipergeométrica; sí, pero en realidad no es una estadística de prueba adecuada para la prueba de dos colas (si hiciéramos una prueba unilateral en la que solo se considerara más asociación en la diagonal principal y no en la segunda diagonal como coherente con la prueba alternativa, entonces sería una estadística de prueba). Este es el mismo problema de una o dos colas con el que comencé.X1,1

[Editar: algunos programas presentan una estadística de prueba para la prueba de Fisher; Supongo que este sería un cálculo de tipo -2logL que sería asintóticamente comparable con un chi-cuadrado. Algunos también pueden presentar la odds ratio o su registro, pero eso no es del todo equivalente.]


Gracias, Glen_b! la distribución de bajo nulo es la distribución hipergeométrica, que no es simétrica alrededor de su media . Entonces me preguntaba sies una estadística de prueba razonable? μ | X 1 , 1 - μ |X1,1μ|X1,1μ|
Tim

Parece una estadística de prueba eminentemente razonable, ya que es completamente interpretable y se entiende fácilmente. De hecho, ninguna de las estadísticas posibles tendrá una distribución simétrica. Olvidemos los detalles de la prueba de Fisher por un momento: si esa estadística es significativa para usted, puede calcular una prueba exacta sobre esa base (utilizando cálculos hipergeométricos para encontrar las probabilidades). Si desea mostrar que están induciendo el mismo orden en todos los casos, esa es probablemente una nueva pregunta.
Glen_b -Reinstale a Mónica el

6

mu | X 1 , 1 - μ | X 1 , 1|X1,1μ|no puede tener una distribución hipergeométrica en general porque no necesita ser un valor entero y luegoNo sería un número entero. Pero condicionalmente en los márgenes, tendrá una distribución hipergeométrica.μ|X1,1μ|X1,1

Si lo hace correctamente y fija los márgenes a valores conocidos, puede considerar (o cualquier otra celda) como su estadística. Con la analogía de sacar bolas de una urna que contiene bolas blancas y bolas negras sin reemplazo, puede interpretarse como el número de bolas blancas extraídas, donde es la suma de la primera fila, es la suma de la segunda fila, es la suma de la primera columna. k W B X 1 , 1 B W kX1,1kWBX1,1BWk


4

Realmente no tiene uno. Las estadísticas de prueba son una anomalía histórica: la única razón por la que tenemos una estadística de prueba es para obtener un valor p. La prueba exacta de Fisher salta más allá de una estadística de prueba y va directamente a un valor p.


Gracias, pero ¿realmente no hay una estadística de prueba? ¿Cómo se determina el valor p entonces?
Tim

El resultado de la prueba exacta de Fisher es el valor p.
Jeremy Miles

@JeremyMiles: ¿Quiere decir que las estadísticas de prueba son anomalías históricas en que antes de la computación de bajo costo, los usuarios calcularon Z, t y así sucesivamente y luego compararon esta estadística de prueba con las tablas precalculadas para determinar la significación estadística y, como resultado, Muchos usuarios actuales de estadísticas inferenciales todavía piensan en términos de estadísticas de prueba cuando podrían proporcionar fácilmente un valor p? En otras palabras, ¿es esto una especie de efecto generacional?
rabidotter

1
@rabidotter: sí, supongo que sí. Ves personas que escriben "F = 14.352, df = 2, 568, p <0.05". La única razón por la que a alguien le importa F es calcular P, pero le dan a F una precisión masiva, y p con muy poca precisión.
Jeremy Miles
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.