En R, tengo una muestra de 348 medidas, y quiero saber si puedo asumir que normalmente se distribuye para futuras pruebas.
Básicamente, siguiendo otra respuesta de Stack , estoy mirando el gráfico de densidad y el gráfico QQ con:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
No tengo una gran experiencia en estadística, pero parecen ejemplos de distribuciones normales que he visto.
Luego estoy ejecutando la prueba Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
Si lo interpreto correctamente, me dice que es seguro rechazar la hipótesis nula, que es que la distribución es normal.
Sin embargo, me he encontrado con dos publicaciones de Stack ( aquí y aquí ), que socavan fuertemente la utilidad de esta prueba. Parece que si la muestra es grande (¿se considera 348 como grande?), Siempre dirá que la distribución no es normal.
¿Cómo debo interpretar todo eso? ¿Debo seguir con el gráfico QQ y asumir que mi distribución es normal?


