Estoy mirando una hoja de Excel que dice estar calculando el , pero no reconozco esta forma de hacerlo, y me preguntaba si me falta algo.
Aquí están los datos que está analizando:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
Y aquí están las sumas que hace para cada grupo para calcular chi cuadrado:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
Entonces, para cada grupo, el es:
2.822793
2.822793
1.759359
4.136448
Y la plaza del total de Chi es: 11.54139
.
Sin embargo, cada ejemplo que he visto de calcular el es completamente diferente de esto. Lo haría para cada grupo:
chiSq = (Observed-Expected)^2 / Expected
Y por lo tanto, para el ejemplo anterior, obtendría un valor de chi cuadrado total de 11.3538
.
Mi pregunta es: ¿por qué en la hoja de Excel están calculando de esta manera? ¿Es este un enfoque reconocido?
ACTUALIZAR
Mi razón para querer saber esto es que estoy tratando de replicar estos resultados en el lenguaje R. Estoy usando la función chisq.test y no sale con el mismo número que la hoja de Excel. Entonces, si alguien sabe cómo hacer este enfoque en R, ¡sería muy útil!
ACTUALIZACIÓN 2
Si alguien está interesado, así es como lo calculé en R:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))