Para preguntas como estas, simplemente ejecutaría una simulación y vería si los valores comportan como espero. El valor p es la probabilidad de extraer aleatoriamente una muestra que se desvía al menos tanto de la hipótesis nula como de los datos que observó si la hipótesis nula es verdadera. Entonces, si tuviéramos muchas de esas muestras, y una de ellas tuviera un valor p de .04, entonces esperaríamos que el 4% de esas muestras tuvieran un valor inferior a .04. Lo mismo es cierto para todos los demás valores p posibles .pppp
A continuación se muestra una simulación en Stata. Los gráficos verifican si los valores miden lo que se supone que miden, es decir, muestran cuánto se desvía la proporción de muestras con valores p inferiores al valor p nominal del valor p nominal . Como puede ver, esa prueba es algo problemática con un número tan pequeño de observaciones. Si es o no demasiado problemático para su investigación es su decisión.pppp
clear all
set more off
program define sim, rclass
tempname z se
foreach i of numlist 5/10 20(10)50 {
drop _all
set obs `i'
gen x = rnormal()
gen y = rnormal()
corr x y
scalar `z' = atanh(r(rho))
scalar `se' = 1/sqrt(r(N)-3)
return scalar p`i' = 2*normal(-abs(`z'/`se'))
}
end
simulate p5 =r(p5) p6 =r(p6) p7 =r(p7) ///
p8 =r(p8) p9 =r(p9) p10 =r(p10) ///
p20=r(p20) p30=r(p30) p40 =r(p40) ///
p50=r(p50), reps(200000) nodots: sim
simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
scheme(s2color) ylabel(,angle(horizontal))
simpplot p20 p30 p40 p50 , name(less_small, replace) ///
scheme(s2color) ylabel(,angle(horizontal))