Mi valoración personal de sus argumentos:
- Aquí habla de usar como evidencia para el Nulo, mientras que su tesis es que no puede usarse como evidencia contra el Nulo. Entonces, creo que este argumento es en gran medida irrelevante.pagspags
- Creo que esto es un malentendido. La prueba pescadores sigue fuertemente la idea del racionalismo crítico de Popper que establece que no puedes apoyar una teoría sino solo criticarla. Entonces, en ese sentido, solo hay una única hipótesis (la Nula) y simplemente verifica si sus datos están de acuerdo con ella.pags
- No estoy de acuerdo aquí. Depende de la estadística de prueba, pero suele ser una transformación de un tamaño de efecto que habla en contra de Null. Entonces, cuanto mayor sea el efecto, menor será el valor p --- todas las demás cosas son iguales. Por supuesto, para diferentes conjuntos de datos o hipótesis esto ya no es válido. pags
- No estoy seguro de entender completamente esta declaración, pero por lo que he entendido que esto es menos un problema de como de personas que lo usan incorrectamente. estaba destinado a tener la interpretación de frecuencia a largo plazo y esa es una característica, no un error. Pero no puede culpar a por las personas que toman un solo valor de como prueba de su hipótesis o por las personas que publican solo . p p p p <pagspagspagspagsp < .05
Su sugerencia de usar la razón de probabilidad como una medida de evidencia es, en mi opinión, una buena (pero aquí la idea de un factor de Bayes es más general), pero en el contexto en el que la presenta es un poco peculiar: primero se va los fundamentos de las pruebas de Fisherian donde no existe una hipótesis alternativa para calcular la razón de probabilidad. Pero como evidencia contra el Nulo es Fisherian. Por lo tanto, él confunde a Fisher y Neyman-Pearson. En segundo lugar, la mayoría de las estadísticas de prueba que utilizamos son (funciones de) la razón de probabilidad y en ese caso es una transformación de la razón de probabilidad. Como dice Cosma Shalizi :ppagspags
entre todas las pruebas de un tamaño dado , el que tiene la menor probabilidad de falla, o la potencia más alta, tiene la forma "diga 'señal' si
, de lo contrario diga 'ruido' , "y que el umbral
varía inversamente con . La cantidad es la razón de probabilidad; El lema de Neyman-Pearson dice que para maximizar la potencia, deberíamos decir "señal" si es suficientemente más probable que el ruido.q ( x ) / p ( x ) > t ( s ) t s q ( x ) / p ( xsq( x ) / p ( x ) > t ( s )tsq( x ) / p ( x )
Aquí es la densidad bajo el estado "señal" y la densidad bajo el estado "ruido". La medida de "suficientemente probable" sería aquí que es . Tenga en cuenta que en las pruebas correctas de Neyman-Pearson, se sustituye por una fija tal que . p ( x ) P ( q ( X ) / p ( x ) > t o b s ∣ H 0 ) p t o b s t ( s ) P ( q ( X ) / p ( x ) > t ( s ) ∣ H 0 ) = αq( x )p ( x )PAGS( q( X) / p ( x ) > to bs∣ H0 0)pagsto b st ( s )PAGS( q( X) / p ( x ) > t ( s ) ∣ H0 0) = α