Creo que es importante recordar que los diferentes métodos son buenos para diferentes cosas, y las pruebas de significación no son todo lo que hay en el mundo de las estadísticas.
1 y 3) EB probablemente no sea un procedimiento de prueba de hipótesis válido, pero tampoco está destinado a serlo.
La validez podría ser muchas cosas, pero usted está hablando del Diseño Experimental Riguroso, por lo que probablemente estamos discutiendo una prueba de hipótesis que se supone que lo ayudará a tomar la decisión correcta con cierta frecuencia a largo plazo. Este es un régimen estrictamente dicotómico de tipo sí / no que es principalmente útil para las personas que tienen que tomar una decisión de tipo sí / no. Hay mucho trabajo clásico sobre esto por personas muy inteligentes. Estos métodos tienen una buena validez teórica en el límite, suponiendo que se cumplan todas sus suposiciones, & c. Sin embargo, EB ciertamente no fue hecho para esto. Si desea la maquinaria de los métodos clásicos de NHST, adhiérase a los métodos clásicos de NHST.
2) EB se aplica mejor en problemas en los que se estiman muchas cantidades variables similares.
El propio Efron abre su libro Inferencia a gran escala que enumera tres eras distintas de la historia de las estadísticas, y señala que actualmente estamos en
[la] era de la producción científica en masa, en la que las nuevas tecnologías tipificadas por el microarray permiten a un solo equipo de científicos producir conjuntos de datos de un tamaño que Quetelet envidiaría. Pero ahora la avalancha de datos va acompañada de una avalancha de preguntas, quizás miles de estimaciones o pruebas de hipótesis que el estadístico tiene la responsabilidad de responder juntos; en absoluto lo que los maestros clásicos tenían en mente.
Él continúa:
Por su naturaleza, los argumentos empíricos de Bayes combinan elementos frecuentistas y bayesianos al analizar problemas de estructura repetida. Las estructuras repetidas son exactamente lo que la producción científica en masa se destaca, por ejemplo, en niveles de expresión que comparan sujetos enfermos y sanos para miles de genes al mismo tiempo por medio de microarrays.
Tal vez la aplicación reciente éxito la mayor parte de EB es limma
, disponibles en Bioconductor . Este es un paquete R con métodos para evaluar la expresión diferencial (es decir, microarrays) entre dos grupos de estudio en decenas de miles de genes. Smyth muestra que sus métodos de EB producen una estadística t con más grados de libertad que si se calcularan estadísticas t genéticas regulares. El uso de EB aquí "es equivalente a la reducción de las variaciones de muestra estimadas hacia una estimación agrupada, lo que da como resultado una inferencia mucho más estable cuando el número de matrices es pequeño", lo que a menudo es el caso.
Como Efron señala anteriormente, esto no se parece en nada al para qué se desarrolló el NHST clásico, y el entorno suele ser más exploratorio que confirmatorio.
4) Generalmente, puede ver EB como un método de contracción, y puede ser útil en todas partes donde la contracción es útil
limma
X1, . . . , Xkθ^JSyo= ( 1 - c / S2) Xyo,S2= ∑kj = 1Xj,doXyo
X¯,
Cuanto más similares sean las cantidades que se estimen, más probable es que la contracción sea útil. El libro al que se refiere utiliza tasas de éxito en el béisbol. Morris (1983) señala un puñado de otras aplicaciones:
- Reparto de ingresos --- oficina del censo. Estima los ingresos del censo per cápita para varias áreas.
- Garantía de calidad --- Bell Labs. Estima el número de fallas para diferentes períodos de tiempo.
- Elaboración de tarifas de seguros. Estima el riesgo por exposición para grupos de asegurados o para diferentes territorios.
- Admisiones a la facultad de derecho. Estima el peso del puntaje LSAT en relación con el GPA para diferentes escuelas.
- Alarmas de incendio --- NYC. Estima la tasa de falsas alarmas para diferentes ubicaciones de cajas de alarma.
Todos estos son problemas de estimación paralela y, que yo sepa, tienen más que ver con hacer una buena predicción de lo que es cierta cantidad que con determinar una decisión de sí / no.
Algunas referencias
- Efron, B. (2012). Inferencia a gran escala: métodos empíricos de Bayes para la estimación, prueba y predicción (Vol. 1). Prensa de la Universidad de Cambridge. Chicago
- Efron, B. y Morris, C. (1973). La regla de estimación de Stein y sus competidores: un enfoque empírico de Bayes. Revista de la Asociación Americana de Estadística, 68 (341), 117-130. Chicago
- James, W. y Stein, C. (1961, junio). Estimación con pérdida cuadrática. En Actas del cuarto simposio de Berkeley sobre estadística matemática y probabilidad (Vol. 1, No. 1961, pp. 361-379). Chicago
- Morris, CN (1983). Inferencia empírica paramétrica de Bayes: teoría y aplicaciones. Revista de la Asociación Americana de Estadística, 78 (381), 47-55.
- Smyth, GK (2004). Modelos lineales y métodos empíricos de Bayes para evaluar la expresión diferencial en experimentos de microarrays. Aplicaciones estadísticas en genética y biología molecular Volumen 3, número 1, artículo 3.