El mayor problema que veo es que no hay una estadística de prueba derivada. valor (con todas las críticas que los estadísticos bayesianos formulan contra él) para un valor de una estadística de prueba se define como (suponiendo que se rechaza el valor nulo para valores mayores de , como sería el caso con las estadísticas , por ejemplo). Si necesita tomar una decisión de mayor importancia, puede aumentar el valor crítico e impulsar la región de rechazo más arriba. Efectivamente, eso es lo que hacen múltiples correcciones de prueba como Bonferroni, indicándole que use un umbral mucho más bajo parat T P r o b [ T ≥ t | H 0 ] T χ 2 p 0 , 1 / 36 , 2 / 36 , ...ptTProb[T≥t|H0]Tχ2p-valores. En cambio, el estadista frecuentista está atrapado aquí con las pruebas de tamaños en la cuadrícula de .0,1/36,2/36,…
Por supuesto, este enfoque "frecuente" no es científico, ya que el resultado difícilmente será reproducible. Una vez que el Sol se convierte en supernova, permanece supernova, por lo que el detector debe seguir diciendo "Sí" una y otra vez. Sin embargo, una ejecución repetida de esta máquina es poco probable que produzca el resultado "Sí" nuevamente. Esto se reconoce en áreas que quieren presentarse como rigurosas y tratar de reproducir sus resultados experimentales ... lo que, hasta donde yo entiendo, ocurre con probabilidad entre el 5% (publicar el documento original fue un error puro de tipo I) y en algún lugar alrededor del 30-40% en algunos campos médicos. La gente de metaanálisis puede completarlo con mejores números, esto es solo el zumbido que me viene de vez en cuando a través de la estadística de la vid.
Otro problema desde la perspectiva frecuentista "adecuada" es que tirar un dado es la prueba menos poderosa, con potencia = nivel de significancia (si no es menor; 2.7% de potencia para el nivel de significancia del 5% no es nada de qué jactarse). La teoría de Neyman-Pearson para las pruebas t agoniza al demostrar que se trata de un UMPT, y una gran cantidad de teoría estadística de cejas (que apenas entiendo, tengo que admitir) se dedica a derivar las curvas de potencia y encontrar las condiciones cuando un determinado La prueba es la más poderosa en una clase determinada. (Créditos: @Dikran Marsupial mencionó el tema del poder en uno de los comentarios).
No sé si esto te preocupa, pero el estadístico bayesiano se muestra aquí como el tipo que no sabe de matemáticas y tiene un problema con el juego. Un estadístico bayesiano adecuado postularía lo anterior, discutiría su grado de objetividad, derivaría lo posterior y demostraría cuánto aprendieron de los datos. Nada de eso se hizo, por lo que el proceso bayesiano se ha simplificado demasiado tanto como el frecuente.
Esta situación demuestra el cribado clásico para el problema del cáncer (y estoy seguro de que los bioestadísticos pueden describirlo mejor que yo). Cuando se examina una enfermedad rara con un instrumento imperfecto, la mayoría de los positivos se convierten en falsos positivos. Los estadísticos inteligentes lo saben, y saben mejor hacer un seguimiento de los analizadores baratos y sucios con biopsias más caras y más precisas.