En La prueba de la insignificancia de la significancia , Johnson (1999) señaló que los valores p son arbitrarios, ya que puede hacerlos tan pequeños como desee mediante la recopilación de datos suficientes, suponiendo que la hipótesis nula sea falsa, lo que casi siempre es. En el mundo real, es improbable que existan correlaciones semi-parciales que sean exactamente cero, lo cual es la hipótesis nula para probar la importancia de un coeficiente de regresión. Los valores de corte de significancia del valor P son aún más arbitrarios. El valor de .05 como límite entre significancia y no significación se usa por convención, no por principio. Entonces, la respuesta a su primera pregunta es no, no hay una forma de principios para decidir sobre un umbral de importancia apropiado.
Entonces, ¿qué puede hacer, dado su gran conjunto de datos? Depende de su (s) motivo (s) para explorar el significado estadístico de sus coeficientes de regresión. ¿Estás tratando de modelar un sistema multifactorial complejo y desarrollar una teoría útil que se ajuste o prediga razonablemente la realidad? Entonces, tal vez podría pensar en desarrollar un modelo más elaborado y adoptar una perspectiva de modelado sobre él, como se describe en Rodgers (2010), The Epistemology of Mathematical And Statistic Modeling . Una ventaja de tener una gran cantidad de datos es poder explorar modelos muy ricos, con niveles múltiples e interacciones interesantes (suponiendo que tenga las variables para hacerlo).
Si, por otro lado, desea hacer un juicio sobre si tratar un coeficiente particular como estadísticamente significativo o no, puede tomar la sugerencia de Good (1982) como se resume en Woolley (2003) : Calcule el valor q como que estandariza los valores p a un tamaño de muestra de 100. Un valor p de exactamente .001 se convierte en un valor p de .045, aún estadísticamente significativo.p⋅(n/100)−−−−−−√
Entonces, si es significativo usar un umbral arbitrario u otro, ¿qué pasa con eso? Si este es un estudio observacional, tiene mucho más trabajo para justificar que en realidad es significativo en su forma de pensar y no solo una relación espuria que aparece porque ha especificado mal su modelo. Tenga en cuenta que un pequeño efecto no es tan clínicamente interesante si representa diferencias preexistentes entre las personas que seleccionan diferentes niveles de tratamiento en lugar de un efecto del tratamiento.
Debe considerar si la relación que está viendo es prácticamente significativa, como han señalado los comentaristas. La conversión de las cifras que cita de a r 2 para la varianza explicada ( r es la correlación, cuadrándola para obtener la varianza explicada) da solo 3 y 6% de varianza explicada, respectivamente, lo que no parece mucho.rr2r