Estoy buscando varias formas de explicar a mis alumnos (en un curso de estadística elemental) qué es una prueba de dos colas y cómo se calcula su valor P.
¿Cómo les explica a sus estudiantes el examen de dos contra uno?
Estoy buscando varias formas de explicar a mis alumnos (en un curso de estadística elemental) qué es una prueba de dos colas y cómo se calcula su valor P.
¿Cómo les explica a sus estudiantes el examen de dos contra uno?
Respuestas:
Esta es una gran pregunta y espero con ansias la versión para todos de explicar el valor p y la prueba de dos colas frente a la de una cola. He estado enseñando estadísticas a otros cirujanos ortopédicos y, por lo tanto, traté de mantenerlo lo más básico posible, ya que la mayoría de ellos no han hecho ninguna matemática avanzada durante 10-30 años.
Comienzo explicando que si creemos que tenemos una moneda justa, sabemos que debería terminar con el 50% de los lanzamientos en promedio ( ). Ahora, si se pregunta cuál es la probabilidad de obtener solo 2 colas de 10 lanzamientos con esta moneda justa, puede calcular esa probabilidad como lo hice en el gráfico de barras. En el gráfico puede ver que la probabilidad de obtener 8 de cada 10 lanzamientos con una moneda justa es de aproximadamente .
Dado que cuestionaríamos la equidad de la moneda si obtuviéramos 9 o 10 colas, tenemos que incluir estas posibilidades, la cola de la prueba. Al sumar los valores, obtenemos que la probabilidad ahora es un poco más de de obtener 2 colas o menos.
Ahora, si obtuviéramos solo 2 caras, es decir, 8 caras (la otra cola), probablemente estaríamos igualmente dispuestos a cuestionar la equidad de la moneda. Esto significa que terminará con una probabilidad de para una prueba de dos colas .
Como en medicina generalmente estamos interesados en estudiar los fracasos, debemos incluir el lado opuesto de la probabilidad, incluso si nuestra intención es hacer el bien e introducir un tratamiento beneficioso.
Este simple ejemplo también muestra cuán dependientes somos de la hipótesis nula para calcular el valor p. También me gusta señalar la semejanza entre la curva binomial y la curva de campana. Al cambiar a 200 lanzamientos, obtienes una forma natural de explicar por qué la probabilidad de obtener exactamente 100 lanzamientos comienza a carecer de relevancia. Los intervalos de interés definitorios son una transición natural a funciones de función de densidad / masa de probabilidad y sus contrapartes acumulativas.
En mi clase, les recomiendo los videos de estadísticas de la academia Khan y también uso algunas de sus explicaciones para ciertos conceptos. También pueden lanzar monedas cuando observamos la aleatoriedad del lanzamiento de la moneda; lo que trato de mostrar es que la aleatoriedad es más aleatoria de lo que generalmente creemos que está inspirado en este episodio de Radiolab .
Por lo general, tengo un gráfico / diapositiva, el código R que usé para crear el gráfico:
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
Suponga que quiere probar la hipótesis de que la altura promedio de los hombres es "5 pies 7 pulgadas". Selecciona una muestra aleatoria de hombres, mide sus alturas y calcula la media de la muestra. Su hipótesis entonces es:
En la situación anterior, realiza una prueba de dos colas ya que rechazaría su valor nulo si el promedio de la muestra es demasiado bajo o demasiado alto.
En este caso, el valor p representa la probabilidad de obtener una media muestral que es al menos tan extrema como la que obtuvimos realmente suponiendo que el valor nulo es verdadero. Por lo tanto, si observamos que la media de la muestra es "5 pies y 8 pulgadas", entonces el valor p representará la probabilidad de que observemos alturas mayores que "5 pies y 8 pulgadas" o alturas menores que "5 pies y 6 pulgadas" siempre que el valor nulo es verdad.
Si, por otro lado, su alternativa se enmarca así:
En la situación anterior, haría una prueba de una cola en el lado derecho. La razón es que preferiría rechazar el valor nulo a favor de la alternativa solo si la media de la muestra es extremadamente alta.
La interpretación del valor p se mantiene igual con el ligero matiz de que ahora estamos hablando de la probabilidad de obtener una media muestral mayor que la que obtuvimos realmente. Por lo tanto, si observamos que la media de la muestra es "5 pies y 8 pulgadas", entonces el valor p representará la probabilidad de que observemos alturas mayores que "5 pies y 8 pulgadas" siempre que el valor nulo sea verdadero.