Cómo funciona la prueba de Chi cuadrado de Pearson

Después de un reciente voto negativo, he estado tratando de verificar mi comprensión de la prueba de Pearson Chi Squared. Usualmente uso la estadística de chi cuadrado (o estadística de chi cuadrado reducido) para ajustar o verificar el ajuste resultante. En este caso, la varianza no suele ser el número esperado de conteos en una tabla o histograma, sino alguna varianza determinada experimentalmente. De cualquier manera, siempre tuve la impresión de que la prueba todavía usaba la normalidad asintótica del PDF multinomial (es decir, mi estadística de prueba es

Q = (n - N m)^{⊤} V^{- 1} (n - N m)

$Q = (n-Nm)^\top V^{-1}(n-Nm)$

y es asintóticamente multinormal donde es la matriz de covarianza). Por lo tanto, tiene una distribución chi-cuadrado dada grande, por lo que el uso del número esperado de recuentos como el denominador en la estadística se vuelve válido para grande . Es posible que esto solo sea cierto para los histogramas, no he analizado una pequeña tabla de datos en años. $(n-Nm)$ $V$ $Q$ $n$ $n$

¿Hay un argumento más sutil que me estoy perdiendo? Me interesaría una referencia, o incluso mejor una breve explicación. (Aunque es posible que me haya votado por omitir la palabra asintótica, lo que reconozco es bastante importante).

chi-squared histogram

— Jugador de bolos
fuente

Después de eso, presumiblemente, también es cierto que uno podría usar exactamente la misma prueba con cualquier información distribuida normalmente. Si tuviera que usar un voltímetro que sabía que tenía algún error distribuido normalmente que había determinado, entonces podría usar, . ¿Es esto cierto? La estadística reducida de chi cuadrado se basa presumiblemente en este hecho.

χ^{2} = \sum_{yo} \frac{(V_{o si s} - V_{mi X pag})^{2}}{σ^{2}}

$\chi^{2} = \sum_{i} \frac{(V_{obs} - V_{exp})^{2}}{\sigma^{2}}$

— Jugador de bolos el

Una prueba de Chi-cuadrado está diseñada para analizar datos categóricos. Eso significa que los datos han sido contados y divididos en categorías. No funcionará con datos paramétricos o continuos. Por lo tanto, no funciona para determinar el ajuste resultante en cada instancia.

Fuente: http://www.ling.upenn.edu/~clight/chisquared.htm

— BradHanks
fuente

Bienvenido a este sitio! No estoy seguro de entender cómo se relaciona esto con la pregunta en cuestión. ¿Le importaría ampliar un poco esta respuesta, teniendo en cuenta que este hilo probablemente se trata más de la prueba de bondad de ajuste que del análisis de tablas de contingencia bidireccionales?

— chl

Puede que haya entendido mal la pregunta, pero me preguntaba si la prueba de chi-cuadrado era apropiada en este ejemplo. Podría estar un poco oxidado ...

— BradHanks

χ^{2}

$\chi^2$

χ^{2}

$\chi^2$