De hecho, los valores p ahora están finalmente 'fuera de moda' también: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . La prueba de significación de hipótesis nula (NHST) produce poco más que una descripción del tamaño de la muestra. (*) Cualquier intervención experimental tendrá algún efecto, lo que significa que la hipótesis nula simple de 'sin efecto' siempre es falsa en sentido estricto . Por lo tanto, una prueba 'no significativa' simplemente significa que el tamaño de su muestra no era lo suficientemente grande; una prueba 'significativa' significa que recopiló suficientes datos para 'encontrar' algo.
El "tamaño del efecto" representa un intento de remediar esto, al introducir una medida en la escala natural del problema. En medicina, donde los tratamientos siempre tienen algún efecto (incluso si se trata de un efecto placebo), se introduce la noción de un "efecto clínicamente significativo" para evitar la probabilidad previa del 50% de que se descubra que un "tratamiento" tiene "a ( estadísticamente) efecto positivo significativo '(aunque minúsculo) en un estudio arbitrariamente grande.
Si entiendo la naturaleza de su trabajo, Clarinetista, al final del día, su objetivo legítimo es informar acciones / intervenciones que mejoren la educación en las escuelas bajo su competencia. Por lo tanto, su entorno es una decisión teórica , y los métodos bayesianos son el enfoque más apropiado (y singularmente coherente [1] ).
De hecho, la mejor manera de comprender los métodos frecuentistas es como aproximaciones a los métodos bayesianos . Se puede entender que el tamaño del efecto estimado apunta a una medida de centralidad para la distribución posterior bayesiana , mientras que el valor p puede entenderse como el objetivo de medir una cola de esa parte posterior. Por lo tanto, juntas estas dos cantidades contienen una idea general de la parte posterior bayesiana que constituye la entrada natural a una perspectiva teórica de decisión sobre su problema. (Alternativamente, un intervalo de confianza frecuentista sobre el tamaño del efecto puede entenderse de la misma manera como un posible intervalo creíble ).
En los campos de la psicología y la educación, los métodos bayesianos son bastante populares. Una razón para esto es que es fácil instalar 'construcciones' en modelos bayesianos, como variables latentes. Es posible que desee ver 'el libro del cachorro' de John K. Kruschke , un psicólogo. En educación (donde tienes estudiantes anidados en aulas, anidados en escuelas, anidados en distritos, ...), el modelado jerárquico es inevitable. Y los modelos bayesianos también son excelentes para el modelado jerárquico. En esta cuenta, puede consultar Gelman & Hill [2].
[1]: Robert, Christian P. La elección bayesiana: de los fundamentos teóricos de la decisión a la implementación computacional. 2da ed. Textos Springer en Estadística. Nueva York: Springer, 2007.
[2]: Gelman, Andrew y Jennifer Hill. Análisis de datos mediante regresión y modelos multinivel / jerárquicos. Métodos analíticos para la investigación social. Cambridge; Nueva York: Cambridge University Press, 2007.
Para más información sobre 'coherencia' desde una perspectiva no necesariamente de golpearlo en la cabeza con un ladrillo bayesiano , vea [3].
[3]: Robins, James y Larry Wasserman. "Condicionamiento, probabilidad y coherencia: una revisión de algunos conceptos fundamentales". Revista de la Asociación Americana de Estadística 95, no. 452 (1 de diciembre de 2000): 1340–46. doi: 10.1080 / 01621459.2000.10474344.
(*) En [4], Meehl azota NHST de manera mucho más elegante, pero no menos abrasiva, que yo:
Dado que la hipótesis nula es casi siempre falsa, las tablas que resumen la investigación en términos de patrones de "diferencias significativas" son poco más que resultados complejos y causalmente ininterpretables de las funciones de poder estadístico.
[4]: Meehl, Paul E. "Riesgos teóricos y asteriscos tabulares: Sir Karl, Sir Ronald y el progreso lento de la psicología blanda". Journal of Consulting and Clinical Psychiatry 46 (1978): 806–34. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
Y aquí hay una cita relacionada de Tukey: /stats//a/728/41404