Prueba de independencia versus prueba de homogeneidad

Estoy enseñando un curso de estadística básica y hoy cubriré la prueba de independencia chi-cuadrado para dos categorías y la prueba de homogeneidad. Estos dos escenarios son conceptualmente diferentes, pero pueden usar la misma estadística y distribución de prueba. En una prueba de homogeneidad, se supone que los totales marginales para una de las categorías son parte del diseño en sí mismo: representan el número de sujetos seleccionados para cada grupo experimental. Pero dado que la prueba de chi cuadrado gira en torno al condicionamiento de todos los totales marginales, no hay consecuencias matemáticas para distinguir entre las pruebas de homogeneidad y las pruebas de independencia con datos categóricos, al menos ninguna cuando se usa esta prueba.

Mi pregunta es la siguiente: ¿hay alguna escuela de pensamiento estadístico o enfoque estadístico que arroje diferentes análisis, dependiendo de si estamos probando la independencia (donde todos los marginales son variables aleatorias) o una prueba de homogeneidad (donde hay un conjunto de marginales establecido por el diseño)?

En el caso continuo, diga dónde observamos sobre el mismo tema y probamos independencia, u observamos en diferentes poblaciones y probamos si provienen de la misma distribución, el método es diferente (correlación análisis vs prueba t). ¿Qué pasa si los datos categóricos provienen de variables continuas discretizadas? ¿Deberían las pruebas de independencia y homogeneidad ser indistinguibles? $(X,Y)$ $(X_1, X_2)$

— Placidia
fuente

¿Puede proporcionar una fuente que distinga "prueba de homogeneidad" y "prueba de independencia"? Solía pensar que es lo mismo (y Wikipedia también). También se llama la prueba de asociación de chi-cuadrado para la tabla de contigencia de 2 vías o la prueba de comparación de chi-cuadrado de muestras independientes de K. No debe confundirse con la prueba de chi-cuadrado de una muestra , también conocida como prueba de acuerdo de chi-cuadrado . En él, probamos las frecuencias observadas contra las esperadas teóricas que suministramos.

— ttnphns

@ttnphns Parece ser endémico. Estoy usando "Espera lo inesperado" de Raluca Balan y Gilles Lamothe. El año pasado enseñé en Business Statistics por Sharpe, De Veaux, et al. Ambos textos hacen una gran comida de la distinción. En ambos casos, tenemos una tabla de contingencia de 2 vías. No hace falta decir que ninguno de los dos libros de texto considera que vale la pena enseñar un tamaño de efecto para la tabla de contingencia: otro caso en el que la sutileza triunfa sobre la utilidad en los cursos básicos de estadísticas.

— Placidia

La diferencia debería aparecer si intenta obtener un intervalo de confianza para el tamaño del efecto.

— Ray Koopman el

Eso suena intrigante. ¿Te importa agregar algunos detalles y hacer que sea una respuesta?

— Placidia

Depende si quieres torturar a los estudiantes por la distinción de márgenes condicionales / incondicionales. Si no, podría centrarse en explicar que "la independencia de dos variables categóricas" es equivalente a "homogeneidad de las distribuciones condicionales" y luego presentar la única . (Por lo general, lo presento junto con límites de confianza más bajos para la verdadera de Cramer que mide la fuerza de la asociación).

χ^{2}

$\chi^2$

V

$V$

— Michael M

Respuestas:

Simplemente tiene que preguntarse: "¿Cómo escribo la hipótesis nula?". Considere una tabla de contingencia de frecuencias de algún comportamiento (y / n) entre varios grupos . Tratando al primer grupo como referente, tiene odds ratios ( ) que describen la asociación entre frecuencia y grupo. $2 \times k$ $k$ $k-1$ $\theta_i, i = 1, 2, \ldots, k-1$

Bajo independencia como con homogeneidad, usted asume que todas las odds ratio son 1. Es decir, la probabilidad de responder "sí" a la condición es igualmente probable independientemente de la asignación del grupo. Si esas suposiciones fallan, al menos un grupo es diferente.

$\mathcal{H}_0(\mbox{homogeneity}): \sum_{i=1}^{k-1} |\theta_i| = 0$

$\mathcal{H}_0(\mbox{independence}): \sum_{i=1}^{k-1} |\theta_i| = 0$

Y esta prueba se puede realizar con la prueba de Chi-cuadrado de Pearson utilizando frecuencias observadas / esperadas, que es la prueba de puntaje para el modelo de regresión logística que se ajusta a las variables indicadoras para la pertenencia al grupo. Estructuralmente, podemos decir que estas pruebas son las mismas. $k-1$

Sin embargo, surgen diferencias cuando consideramos la naturaleza del factor de agrupación. En este sentido, la aplicación contextual de la prueba, o más bien su nombre, es importante. Un grupo puede ser directamente causal de un resultado, como la presencia o ausencia de un gen o patrones de alelos de un rasgo en cuyo caso, cuando rechazamos el valor nulo, concluimos que el resultado depende del factor de agrupación en cuestión.

Por otro lado, cuando probamos la homogeneidad, nos exoneramos de hacer suposiciones causales. Por lo tanto, cuando el "grupo" es una construcción sofisticada como la raza (que causa y es causada por determinantes genéticos, conductuales y socioeconómicos) podemos sacar conclusiones como "las minorías raciales-étnicas experimentan disparidades de vivienda como lo demuestra la heterogeneidad en el índice de privación del vecindario" . Si alguien contrarrestara tal argumento diciendo: "bueno, eso es porque las minorías logran una educación más baja, obtienen ingresos más bajos y obtienen menos empleo", podría decir: "No afirmé que su raza causó estas cosas, simplemente eso si se mira en la raza de uno, puedes hacer predicciones sobre sus condiciones de vida ".

De ese modo, las pruebas de dependencia son un caso especial de pruebas de homogeneidad donde el posible efecto de los factores de acecho es de interés y debe manejarse en un análisis estratificado. El uso del ajuste multivariado en el modelo de regresión logística análogo logra tal cosa, y aún podemos decir que estamos realizando una prueba de dependencia, pero no necesariamente de homogeneidad.

— AdamO
fuente

Hay una clara diferencia entre los dos problemas si los modela a la manera bayesiana. En algunos documentos, el primer caso (homogeneidad) se denomina muestreo con "un margen fijo" y el segundo caso (independencia) como "tabla total fija". Eche un vistazo, por ejemplo, a Casella et al. (JASA 2009) .
Estoy trabajando en este tema, pero mi trabajo, que también describe esta distinción, aún no está publicado :)

— Emanuele
fuente

También hay una clara diferencia desde una perspectiva frecuentista: es solo que asintóticamente no importa, y los argumentos a menudo se hacen para condicionar uno o ambos márgenes en cualquier caso.

— Scortchi - Restablece a Monica