En pocas palabras, el argumento de Birnbaum es que dos principios ampliamente aceptados implican lógicamente que el principio de probabilidad debe ser válido. El contraargumento de Mayo es que la prueba es incorrecta porque Birnbaum hace mal uso de uno de los principios.
A continuación simplifico los argumentos en la medida en que no son muy rigurosos. Mi propósito es hacerlos accesibles a una audiencia más amplia porque los argumentos originales son muy técnicos. Los lectores interesados deben ver los detalles en los artículos vinculados en la pregunta y en los comentarios.
En aras de la concreción, me centraré en el caso de una moneda con sesgo desconocido . En el experimento lo 10 veces. En el experimento lo hasta obtener 3 "colas". En el experimento lanzamos una moneda justa con la etiqueta "1" y "2": si aterriza un "1", realizamos ; si aterriza un "2" realizamos . Este ejemplo simplificará enormemente la discusión y exhibirá la lógica de los argumentos (las pruebas originales son, por supuesto, más generales).θE1E2EmixE1E2
Los principios:
Los siguientes dos principios son ampliamente aceptados:
El Principio de condicionalidad débil dice que debemos sacar las mismas conclusiones si decidimos realizar el experimento , o si decidimos realizar y la moneda aterriza "1".E1Emix
El Principio de Suficiencia dice que debemos sacar las mismas conclusiones en dos experimentos donde una estadística suficiente tiene el mismo valor.
El siguiente principio es aceptado por Bayesian pero no por los frecuentistas. Sin embargo, Birnbaum afirma que es una consecuencia lógica de los dos primeros.
El Principio de Probabilidad dice que deberíamos sacar las mismas conclusiones en dos experimentos donde las funciones de probabilidad son proporcionales.
Teorema de Birnbaum:
Digamos que realizamos y obtenemos 7 "cabezas" de cada diez lanzamientos. La función de probabilidad de es . Realizamos y la moneda 10 veces para obtener 3 "colas". La función de probabilidad de es . Las dos funciones de probabilidad son proporcionales.E1θ(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Birnbaum considera la siguiente estadística en de a :
donde e son los números de "caras" y "colas", respectivamente. Entonces, pase lo que pase, informa el resultado como si viniera del experimento . Resulta que es suficiente para en . El único caso que no es trivial es cuando e , donde tenemosEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Todos los demás casos son 0 o 1, excepto , que es el complemento de la probabilidad anterior. La distribución de dado es independiente de , por lo que es una estadística suficiente para .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Ahora, de acuerdo con el principio de suficiencia, debemos concluir lo mismo para y en , y del principio de condicionalidad débil, debemos concluir lo mismo para en y en , así como para en y en . Por lo tanto, nuestra conclusión debe ser la misma en todos los casos, que es el principio de probabilidad.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
Contra-prueba de Mayo:
La configuración de Birnbaum no es un experimento de mezcla porque no se observó el resultado de la moneda etiquetada "1" y "2" , por lo tanto, el principio de condicionalidad débil no se aplica a este caso .
Tome la prueba versus y saque una conclusión del valor p de la prueba. Como observación preliminar, tenga en cuenta que el valor p de en viene dado por la distribución binomial como aproximadamente ; El valor p de en viene dado por la distribución binomial negativa como aproximadamente .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Aquí viene la parte importante: el valor p de en se da como el promedio de los dos; recuerde que no conocemos el estado de la moneda, es decir, aproximadamente . Sin embargo, el valor p de en , donde se observa la moneda, es el mismo que en , es decir , aproximadamente . El principio de condicionalidad débil se mantiene (la conclusión es la misma en y en donde la moneda cae "1") y, sin embargo, el principio de probabilidad no. El contraejemplo refuta el teorema de Birnbaum.T=(1,7,3)Emix0.1309(1,7,3)EmixE10.1719E1Emix
La refutación de Peña y Berger de la contra prueba de Mayo:
Mayo cambió implícitamente la declaración del principio de suficiencia: interpreta "las mismas conclusiones" como "el mismo método". Tomar el valor p es un método de inferencia, pero no una conclusión.
El principio de suficiencia dice que si existe una estadística suficiente, entonces las conclusiones deben ser las mismas, pero no requiere que se use la estadística suficiente. Si lo hiciera, conduciría a una contradicción, como lo demostró Mayo.