Prueba de hipótesis versus estimación de parámetros
Típicamente, las hipótesis se enmarcan de manera binaria. Pondré las hipótesis direccionales a un lado, ya que no cambian mucho el problema. Es común, al menos en psicología, hablar de hipótesis como: la diferencia entre las medias grupales es o no es cero; la correlación es o no es cero; el coeficiente de regresión es o no es cero; el cuadrado r es o no es cero. En todos estos casos, existe una hipótesis nula de ningún efecto, y una hipótesis alternativa de un efecto.
Este pensamiento binario generalmente no es lo que más nos interesa. Una vez que piense en su pregunta de investigación, casi siempre encontrará que realmente está interesado en estimar los parámetros. Usted está interesado en la diferencia real entre las medias grupales, o el tamaño de la correlación, o el tamaño del coeficiente de regresión, o la cantidad de varianza explicada.
Por supuesto, cuando obtenemos una muestra de datos, la estimación de la muestra de un parámetro no es la misma que el parámetro de población. Por lo tanto, necesitamos una forma de cuantificar nuestra incertidumbre sobre cuál podría ser el valor del parámetro. Desde una perspectiva frecuentista, los intervalos de confianza proporcionan un medio para hacerlo, aunque los puristas bayesianos podrían argumentar que no permiten estrictamente la inferencia que usted quiera hacer. Desde una perspectiva bayesiana, los intervalos creíbles en densidades posteriores proporcionan un medio más directo de cuantificar su incertidumbre sobre el valor de un parámetro de población.
Parámetros / tamaños de efectos
Alejarse del enfoque de prueba de hipótesis binarias lo obliga a pensar de manera continua. Por ejemplo, ¿qué diferencia de tamaño en el grupo significa sería teóricamente interesante? ¿Cómo mapearías la diferencia entre los medios grupales en el lenguaje subjetivo o las implicaciones prácticas? Las medidas de efecto estandarizadas junto con las normas contextuales son una forma de construir un lenguaje para cuantificar lo que significan los diferentes valores de los parámetros. Dichas medidas a menudo se denominan "tamaños de efecto" (p. Ej., Cohen's d, r, , etc.). Sin embargo, es perfectamente razonable, y a menudo preferible, hablar sobre la importancia de un efecto utilizando medidas no estandarizadas (p. Ej., La diferencia en el grupo significa en variables significativas no estandarizadas como los niveles de ingresos, la esperanza de vida, etc.).R2
Existe una gran literatura en psicología (y otros campos) que critica un enfoque en los valores p, pruebas de significado de hipótesis nulas, etc. (ver esta búsqueda de Google Académico ). Esta literatura a menudo recomienda informar los tamaños de los efectos con intervalos de confianza como resolución (por ejemplo, APA Task force de Wilkinson, 1999).
Pasos para alejarse de la prueba de hipótesis binarias
Si está pensando en adoptar este pensamiento, creo que hay enfoques progresivamente más sofisticados que puede adoptar:
- Enfoque 1a. Informe la estimación puntual de su efecto de muestra (p. Ej., Diferencias de medias de grupo) en términos brutos y estandarizados. Cuando reporte sus resultados, discuta qué significaría tal magnitud para la teoría y la práctica.
- Enfoque 1b. Agregue a 1a, al menos a un nivel muy básico, un cierto sentido de la incertidumbre en torno a la estimación de su parámetro en función del tamaño de su muestra.
- Enfoque 2. También informe los intervalos de confianza en los tamaños de los efectos e incorpore esta incertidumbre en su pensamiento sobre los valores plausibles del parámetro de interés.
- Enfoque 3. Informe los intervalos creíbles de Bayesian y examine las implicaciones de varios supuestos sobre ese intervalo creíble, como la elección del proceso previo de generación de datos implícito en su modelo, etc.
Entre muchas referencias posibles, verá a Andrew Gelman hablar mucho sobre estos temas en su blog y en su investigación.
Referencias
- Nickerson, RS (2000). Prueba de significación de hipótesis nulas: una revisión de una vieja y continua controversia. Métodos psicológicos, 5 (2), 241.
- Wilkinson, L. (1999). Métodos estadísticos en revistas de psicología: pautas y explicaciones. Psicólogo estadounidense, 54 (8), 594. PDF