Supongamos que tengo tres poblaciones con cuatro características mutuamente excluyentes. Tomo muestras aleatorias de cada población y construyo una tabla cruzada o tabla de frecuencias para las características que estoy midiendo. ¿Estoy en lo cierto al decir que:
Si quisiera probar si existe alguna relación entre las poblaciones y las características (por ejemplo, si una población tiene una frecuencia más alta de una de las características), debería realizar una prueba de ji cuadrado y ver si el resultado es significativo.
Si la prueba de ji cuadrado es significativa, solo me muestra que hay alguna relación entre las poblaciones y las características, pero no cómo están relacionadas.
Además, no todas las características deben estar relacionadas con la población. Por ejemplo, si las diferentes poblaciones tienen distribuciones significativamente diferentes de las características A y B, pero no de C y D, entonces la prueba de ji cuadrado puede volver a ser significativa.
Si quisiera medir si la población afecta o no a una característica específica, entonces puedo realizar una prueba para proporciones iguales (he visto que esto se llama prueba z, o como
prop.test()
enR
) solo en esa característica.
En otras palabras, ¿es apropiado usar el prop.test()
para determinar con mayor precisión la naturaleza de una relación entre dos conjuntos de categorías cuando la prueba de chi-cuadrado dice que hay una relación significativa?