Esta es una gran pregunta.
La prueba exacta de Fisher es uno de los grandes ejemplos del uso inteligente del diseño experimental de Fisher , junto con el condicionamiento de los datos (básicamente en tablas con la fila observada y los totales marginales) y su ingenio para encontrar distribuciones de probabilidad (aunque este no es el mejor ejemplo , para un mejor ejemplo ver aquí ). El uso de computadoras para calcular valores p "exactos" definitivamente ha ayudado a obtener respuestas precisas.
Sin embargo, es difícil justificar los supuestos de la prueba exacta de Fisher en la práctica. Debido a que el llamado "exacto" proviene del hecho de que en el "experimento de degustación de té" o en el caso de tablas de contingencia 2x2, el total de la fila y el total de la columna, es decir, los totales marginales se fijan por diseño. Esta suposición rara vez se justifica en la práctica. Para buenas referencias ver aquí .
El nombre "exacto" lleva a uno a creer que los valores p dados por esta prueba son exactos, lo que desafortunadamente en la mayoría de los casos no es correcto debido a estas razones.
- Si los marginales no están fijos por diseño (lo que ocurre casi siempre en la práctica), los valores p serán conservadores.
- Dado que la prueba utiliza una distribución de probabilidad discreta (específicamente, distribución hipergeométrica), para ciertos puntos de corte es imposible calcular las "probabilidades nulas exactas", es decir, el valor p.
En la mayoría de los casos prácticos, el uso de una prueba de razón de probabilidad o prueba de Chi-cuadrado no debería dar respuestas muy diferentes (valor p) de una prueba exacta de Fisher. Sí, cuando los márgenes son fijos, la prueba exacta de Fisher es una mejor opción, pero esto sucederá raramente. Por lo tanto, siempre se recomienda el uso de la prueba de Chi-cuadrado de la razón de probabilidad para las comprobaciones de consistencia.
Se aplican ideas similares cuando la prueba exacta de Fisher se generaliza a cualquier tabla, lo que básicamente equivale a calcular probabilidades hipergeométricas multivariadas. Por lo tanto, siempre se debe tratar de calcular los valores p basados en la distribución de Chi-cuadrado y la razón de probabilidad, además de los valores p "exactos".