Me gustaría ver una extensión de esta discusión sobre el antiguo debate de chi-sq vs. prueba exacta de Fisher, ampliando un poco el alcance. Hay muchas pruebas de interacciones en una tabla de contingencia, suficientes para hacer que mi cabeza gire. Espero obtener una explicación de qué prueba debo usar y cuándo, y, por supuesto, una explicación de por qué una prueba debe preferirse a otra.
Mi problema actual es el clásico caso , pero las respuestas con respecto a una mayor dimensionalidad son bienvenidas, al igual que los consejos para implementar las diversas soluciones en R, al menos, en los casos en que no es obvio cómo proceder.
A continuación he enumerado todas las pruebas que conozco; Espero que al exponer mis errores puedan corregirse.
. El viejo en espera. Aquí hay tres opciones principales:
- La corrección incorporada en R para tablas 2x2: "la mitad se resta de todas las diferencias ." ¿Debería estar siempre haciendo esto?
- " " Prueba, no estoy seguro de cómo hacer esto en R.
- Simulación del Monte Carlo. ¿Esto es siempre lo mejor? ¿Por qué R no me da df cuando hago esto?
-
- Tradicionalmente se aconseja cuando se espera que cualquier celda sea <4, pero aparentemente algunos disputan este consejo.
- ¿Es la suposición (generalmente falsa) de que los marginales están arreglados realmente el mayor problema con esta prueba?
-
- Otra prueba exacta, excepto que nunca he oído hablar de ella.
Regresión de Poisson
- Una cosa que siempre me confunde acerca de glms es exactamente cómo hacer estas pruebas de significación, por lo que agradecería su ayuda. ¿Es mejor hacer una comparación de modelos anidados? ¿Qué pasa con una prueba de Wald para un predictor particular?
- ¿Realmente debería estar siempre haciendo regresión de Poisson? ¿Cuál es la diferencia práctica entre esto y una ?