La prueba de bondad de ajuste utiliza la siguiente estadística : χ 2 0 = n ∑ i = 1 ( O i - E i ) 2 En la prueba, la concesión de que se cumplen las condiciones, se utiliza elchi2-distribuciónpara calcular el valor de p que dado elH0es cierto que uno observar un valor tal en una muestra representativa del mismo tamaño.
Sin embargo, para que una estadística siga una distribución χ 2 (con n - 1 grados de libertad), debe ser cierto que: n ∑ i = 1 ( O i - E i ) 2 paraZinormal normal independiente(Wikipedia). Las condiciones para la prueba son las siguientes (nuevamente, deWikipedia):
- Muestra representativa de población
- Gran tamaño de la muestra
- El recuento de células esperado es suficientemente grande
- Independencia entre cada categoría.
A partir de las condiciones (1,2) está claro que satisfacemos las condiciones para la inferencia de la muestra a la población. (3) parece ser una suposición requerida porque el recuento discreto , que está en el denominador, no da como resultado una distribución casi continua para cada Z i y si no es lo suficientemente grande, hay un error que puede corregirse con la corrección de Yates - esto parece ser el hecho de que una distribución discreta es básicamente un 'derribado' continuo, por lo que el cambio de 1 / 2 para cada uno corrige esto.
La necesidad de (4) parece ser útil más tarde, pero no puedo ver cómo.
Al principio, pensé que es necesario para que la estadística coincida con la distribución. Esto me lleva a la suposición cuestionable de queOi-Ei∼N(0,√, que de hecho estaba mal. De hecho, de la reducción de la dimensión para dos lados de la igualdad denan-1está claroque este no puede ser el caso.