Quiero calcular un valor p para rechazar H0 en el nivel de significancia α iff p <α; demostrando que mi población está normalmente distribuida.
La distribución normal surge cuando los datos son generados por una serie de eventos aditivos (vea la imagen de quincunx a continuación). Eso significa que no hay retroalimentación ni correlaciones, ¿eso suena como el proceso que lidera sus datos? Si no, probablemente no sea normal.
Existe la posibilidad de que ese tipo de proceso pueda estar ocurriendo en su caso. Lo más cercano que puede llegar a "probar" es recopilar datos suficientes para descartar cualquier otra distribución que las personas puedan tener (lo que probablemente no sea práctico). Otra forma es deducir la distribución normal de alguna teoría junto con algunas otras predicciones. Si los datos son consistentes con todos ellos y nadie puede pensar en otra explicación, esa sería una buena evidencia a favor de la distribución normal.
https://en.wikipedia.org/wiki/Bean_machine
Ahora, si no espera ninguna distribución específica a priori, aún puede ser razonable usar la distribución normal para resumir los datos, pero reconozca que esto es esencialmente una elección por ignorancia ( https://en.wikipedia.org/wiki/ Principio_de_entropía máxima ). En este caso, no desea saber si la población está normalmente distribuida, sino saber si la distribución normal es una aproximación razonable para el próximo paso.
En ese caso, debe proporcionar sus datos (o datos generados que sean similares) junto con una descripción de lo que planea hacer con ellos, luego preguntar "¿De qué maneras puede suponer normalidad en este caso confundirme?"