Múltiples pruebas de ji cuadrado


11

Tengo datos clasificados cruzados en una tabla de 2 x 2 x 6. Llamemos a las dimensiones response, Ay B. Encajo una regresión logística a los datos con el modelo response ~ A * B. Un análisis de la desviación de ese modelo dice que ambos términos y su interacción son significativos.

Sin embargo, al observar las proporciones de los datos, parece que solo 2 o más niveles Bson responsables de estos efectos significativos. Me gustaría probar para ver qué niveles son los culpables. En este momento, mi enfoque es realizar 6 pruebas de chi-cuadrado en tablas de 2 x 2 response ~ A, y luego ajustar los valores de p de esas pruebas para comparaciones múltiples (usando el ajuste de Holm).

Mi pregunta es si hay un mejor enfoque para este problema. ¿Existe un enfoque de modelado más basado en principios o un enfoque de comparación de prueba de chi-cuadrado múltiple?


Una vez hice la misma pregunta en la lista de correo de R y no obtuve respuesta. Le sugiero que cambie su título, ya que su pregunta se refiere al "análisis post hoc de chi cuadrado para detectar la causa de la importancia" (un título más corto que el que propuse sería mejor :))
Tal Galili

Simplemente mire las versiones beta de sus culpables ... Y use un modelo log-lineal de Poisson. Luego obtienes lo mismo que te da la prueba de chi-cuadrado, pero obtienes todas las diferentes pruebas a la vez.
probabilidadislogica

Respuestas:


11

Debes buscar en "particionar chi-cuadrado". Esto es similar en lógica a la realización de pruebas post-hoc en ANOVA. Le permitirá determinar si su prueba general significativa es atribuible principalmente a diferencias en categorías particulares o grupos de categorías.

Un rápido google apareció en esta presentación, que al final discute métodos para particionar chi-cuadrado.

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf


Interesante. ¿Alguna vez te encontraste con una implementación R de esto?
Tal Galili el

No, no directamente. Sin embargo, R le dará todo lo que necesita para hacer esto, como: los recuentos observados, los valores esperados y los residuos para cada celda. x <- matriz (c (12, 5, 7, 7), ncol = 2) chisq.test (x) observado chisq.test (x) $ residualesexpectedchisq.test(x)
Brett

Te daré la señal, ya que esto debería ser útil para mi vida de investigación. Sin embargo, este enfoque es aplicable a una matriz ixj. Sin embargo, mi pregunta involucra una matriz ixjxk,
JoFrhwld

2
La partición de chi-cuadrado es extensible a tablas de contingencia de múltiples vías. Aquí está el artículo que Agresti cita en su libro, de hecho ... HO Lancaster (1951) "Tablas complejas de contingencia tratadas por la partición de χ2" Diario de la Royal Statistical Society. Serie B (Metodológica), vol. 13, N ° 2
Brett

1

El enfoque sin principios es descartar los datos desproporcionados, volver a ajustar el modelo y ver si las razones de probabilidad logit / condicional para la respuesta y A son muy diferentes (controlando para B). Esto podría decirle si hay motivo de preocupación. Agrupar los niveles de B es otro enfoque. En líneas más basadas en principios, si le preocupan las proporciones relativas que inducen la paradoja de Simpson, puede analizar las razones de probabilidades condicionales y marginales de respuesta / A y ver si se invierten.

Para evitar comparaciones múltiples en particular, lo único que se me ocurre es usar un modelo jerárquico que tenga en cuenta los efectos aleatorios en todos los niveles.


0

No sé exactamente cuáles son sus objetivos, o por qué son lo que son. Pero en lugar de las pruebas de hipótesis, generalmente recomiendo centrar la atención en las predicciones y los intervalos de confianza.


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.