Cómo especificar la hipótesis nula en la prueba de hipótesis

15

¿Cuál es una buena regla general para elegir la pregunta para la hipótesis nula? Por ejemplo, si quiero verificar si la hipótesis B es verdadera, ¿debo usar B como nulo, B como hipótesis alternativa o NO B como nulo? Espero que la pregunta sea clara. Sé que tiene algo que ver con el error que quiero minimizar (¿Tipo I?), Pero sigo olvidando cómo funciona, porque no tengo una intuición clara para ello. Gracias.

hypothesis-testing

— Néstor
fuente

Chicos ... excelentes respuestas. Todo servicial Todavía me sorprende cuando obtengo este nivel de colaboración en la web, solo porque la gente está interesada. Wow gracias !

— Nestor

17

Una regla general de un buen asesor mío era establecer la hipótesis nula para el resultado que no desea que sea cierto, es decir, el resultado cuyo opuesto directo desea mostrar.

Ejemplo básico: suponga que ha desarrollado un nuevo tratamiento médico y desea demostrar que, de hecho, es mejor que el placebo. Entonces, establece la hipótesis nula nuevo tratamiento es igual o peor que el placebo y la hipótesis alternativa nuevo tratamiento es mejor que el placebo. $H_0:=$ $H_1:=$

Esto se debe a que en el curso de una prueba estadística rechazas la hipótesis nula (y favoreces la hipótesis alternativa) o no puedes rechazarla. Dado que su "objetivo" es rechazar la hipótesis nula, la establece en el resultado que no desea que sea cierto.

Nota al margen: Soy consciente de que no se debe configurar una prueba estadística para torcerla y romperla hasta que se rechace la hipótesis nula, el lenguaje informal solo se usó para hacer que esta regla sea más fácil de recordar.

Esto también puede ser útil: ¿Cuál es el significado de los valores p y los valores t en las pruebas estadísticas? y / o ¿Cuál es una buena introducción a las pruebas de hipótesis estadísticas para informáticos?

— steffen
fuente

6

Si la hipótesis B es la hipótesis interesante, puede tomar no-B como la hipótesis nula y controlar, bajo la nula, la probabilidad del error de tipo I por rechazar erróneamente no-B en el nivel . Rechazar no-B se interpreta como evidencia a favor de B porque controlamos el error tipo I, por lo tanto, es poco probable que no-B sea cierto. Confundido ...? $\alpha$

Tomemos el ejemplo de tratamiento versus ningún tratamiento en dos grupos de una población. La hipótesis interesante es que el tratamiento tiene un efecto, es decir, hay una diferencia entre el grupo tratado y el grupo no tratado debido al tratamiento. La hipótesis nula es que no hay diferencia, y controlamos la probabilidad de rechazar erróneamente esta hipótesis. Por lo tanto, controlamos la probabilidad de concluir erróneamente que hay un efecto de tratamiento cuando no hay efecto de tratamiento. El error tipo II es la probabilidad de aceptar erróneamente el valor nulo cuando hay un efecto de tratamiento.

La formulación anterior se basa en el marco de Neyman-Pearson para pruebas estadísticas, donde las pruebas estadísticas se consideran un problema de decisión entre casos, lo nulo y lo alternativo. El nivel es la fracción de veces que cometemos un error tipo I si (independientemente) repetimos la prueba. En este marco, realmente no hay ninguna distinción formal entre lo nulo y lo alternativo. Si intercambiamos el nulo y la alternativa, intercambiamos la probabilidad de errores de tipo I y tipo II. Sin embargo, no controlamos la probabilidad de error de tipo II anterior (depende de cuán grande sea el efecto del tratamiento), y debido a esta asimetría, podemos preferir decir que no rechazamos $\alpha$ la hipótesis nula (en lugar de eso aceptamos la hipótesis nula). Por lo tanto, debemos tener cuidado al concluir que la hipótesis nula es verdadera solo porque no podemos rechazarla.

En un marco de prueba de significancia de Fisher realmente solo hay una hipótesis nula y se calcula, bajo el nulo, un valor para los datos observados. Los valores más pequeños se interpretan como evidencia más fuerte contra el nulo. Aquí la hipótesis nula definitivamente no es B (sin efecto del tratamiento) y el valor se interpreta como la cantidad de evidencia contra el nulo. Con un valor pequeño , podemos rechazar con confianza el valor nulo, que no hay efecto del tratamiento, y concluir que existe un efecto del tratamiento. En este marco solo podemos rechazar o no rechazar (nunca aceptar) el nulo, y se trata de falsificar el nulo. Tenga en cuenta que la $p$ $p$ $p$ $p$ $p$ -valor no necesita ser justificado por un número repetido (imaginario) de decisiones.

Ninguno de los marcos está exento de problemas, y la terminología a menudo es confusa. Puedo recomendar el libro Evidencia estadística: un paradigma de probabilidad de Richard M. Royall para un tratamiento claro de los diferentes conceptos.

— NRH
fuente

5

La respuesta "frecuente" es inventar una hipótesis nula de la forma "no B" y luego argumentar en contra de "no B", como en la respuesta de Steffen. Este es el equivalente lógico de hacer el argumento "Estás equivocado, por lo tanto, debo tener razón". Este es el tipo de razonamiento que utiliza el político (es decir, la otra parte es mala, por lo tanto, nosotros somos buenos). Es bastante difícil tratar con más de 1 alternativa bajo este tipo de razonamiento. Esto se debe a que el argumento "estás equivocado, por lo tanto estoy en lo correcto" solo tiene sentido cuando no es posible que ambos estén equivocados, lo que ciertamente puede suceder cuando hay más de una hipótesis alternativa.

La respuesta "bayesiana" es simplemente calcular la probabilidad de la hipótesis que le interesa probar, condicional a cualquier evidencia que tenga. Siempre contiene información previa, que son simplemente las suposiciones que ha hecho para plantear bien su problema (todos los procedimientos estadísticos se basan en información previa, los bayesianos simplemente los hacen más explícitos). Por lo general, también consta de algunos datos, y tenemos el teorema de Bayes

P (H_{0} | D I) = \frac{P (H_{0} | I) P (D | H_{0} I)}{\sum_{k} P (H_{k} | I) P (D | H_{k} I)}

$P(H_{0}|DI)=\frac{P(H_{0}|I)P(D|H_{0}I)}{\sum_{k}P(H_{k}|I)P(D|H_{k}I)}$

$H_0$ $H_0$ es la "alternativa" Son solo las connotaciones implicadas por las palabras "nulo" y "alternativa" lo que las hace parecer diferentes. Puede mostrar equivalencia en el caso del "Lema de Neyman Pearson" cuando hay dos hipótesis, ya que esta es simplemente la razón de probabilidad, que se da de inmediato tomando las probabilidades del teorema de Bayes anterior:

\frac{P (H_{0} | D I)}{P (H_{1} | D I)} = \frac{P (H_{0} | I)}{P (H_{1} | I)} \times \frac{P (D | H_{0} I)}{P (D | H_{1} I)} = \frac{P (H_{0} | I)}{P (H_{1} | I)} \times Λ

$\frac{P(H_{0}|DI)}{P(H_{1}|DI)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\frac{P(D|H_{0}I)}{P(D|H_{1}I)}=\frac{P(H_{0}|I)}{P(H_{1}|I)}\times\Lambda$

$H_0$ $\Lambda > \tilde{\Lambda}$ $\tilde{\Lambda}$ $H_1$ $\frac{L_2}{L_1}$ $L_1$ $L_2$

$\Lambda^{-1}<\tilde{\Lambda}^{-1}$

— probabilidadislogica
fuente

3

Ese primer párrafo es una parodia del enfoque clásico para la prueba de hipótesis.

— whuber

La prueba de hipótesis no siempre es una cuestión de tomar una decisión. A menudo se formula como tal, pero en ciencia la pregunta puede ser documentar que el nulo es falso y por cuánto. Veo el juego de palabras como un recordatorio de este objetivo. Desde este punto de vista, no rechazar no es una decisión de aceptar sino una falta de evidencia en los datos para rechazar.

— NRH

@NRH: estoy de acuerdo, pero ese no es siempre el objetivo. Si quieres probar una nueva teoría, quieres saber qué tan probable es que sea verdad, tanto como quieras saber qué tan probable es que sea falsa. Y aunque una prueba de hipótesis no siempre conduce directamente a una decisión, parece una pérdida de tiempo molestarse en probarla si finalmente no lleva a una decisión. De hecho, ya está formulando una decisión en su comentario: "actuar como si el nulo es falso". Solo hay una alternativa a esto: "actuar como si el nulo es verdadero". Si hay más de una alternativa, entonces la hipótesis ...

— probabilidad es

(continuación) .. la prueba no ha sido bien definida y está "mal planteada matemáticamente", por así decirlo. Puede haber una gran incertidumbre acerca de esta decisión, pero no hay otras alternativas, el valor nulo no puede ser verdadero ni falso al mismo tiempo, a menos que tenga un problema ambiguo o mal planteado. Pero en este caso la prueba de hipótesis no tiene sentido: no puede haber una conclusión adecuada.

— probabilityislogic

(continuando la diatriba) - y si el objetivo es simplemente cuantificar la evidencia contra el nulo, entonces no necesita una prueba de hipótesis. Para eso está el valor p: no es necesario que acepte o rechace, solo informe su valor.

— probabilityislogic

1

La hipótesis nula generalmente debe suponer que las diferencias en una variable de respuesta se deben solo al error.

Ax $H_0$ Ax

No rechazar esta hipótesis nula se interpretaría como:

1) cualquier diferencia xse debe a un error solo y no Ao,

2) que los datos son inadecuados para detectar una diferencia aunque exista una (vea el error Tipo 2 a continuación).

$H_a$ Ax

$H_0$ Ax $H_0$ Ax

— DQdlM
fuente

1

El tercer párrafo parece implicar que no rechazar el nulo significa que el nulo es verdadero, pero claramente eso es incorrecto: la alternativa podría ser verdadera (y típicamente lo es), pero no difiere lo suficiente del nulo para ser detectado con los datos dados.

— whuber

@whuber - buen punto, editaré la respuesta para reflejar esto

— DQdlM