¿Cómo mostrar mejor gráficamente el error tipo II (beta), la potencia y el tamaño de la muestra?

Me piden que escriba una introducción a las estadísticas y estoy luchando por cómo mostrar gráficamente la forma en que se relacionan el valor p y el poder. Se me ocurrió este gráfico:

Dos curvas de Gauss interactuando

Mi pregunta: ¿hay una mejor manera de mostrar esto?

Aquí está mi código R

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Actualizar

Gracias por las excelentes respuestas. He cambiado algo del código:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

Me gusta la imagen discontinua y ligeramente vaga de la hipótesis nula porque indica que no está realmente allí. He pensado en la transparencia y en agregar el alfa, pero me preocupa obtener demasiada información en una imagen y, por lo tanto, he decidido no hacerlo.

ingrese la descripción de la imagen aquí

Las limitaciones de los artículos impresos no me permiten dejar que los lectores experimenten. Elegí la respuesta de @Greg Snow con TeachingDemos como mi respuesta, ya que me encanta la idea con los dos errores que no se superponen.

r teaching power

— Max Gordon
fuente

Puede mejorar su gráfico ligeramente utilizando pseudo-transparencia. Algo así como en esta respuesta .

— caracal

@caracal (+1) Debería haber agregado un patrón elegante (como usted) para el área que muestra potencia.

— chl

Esto es bueno, he visto tramas similares en otros lugares. Pero esto no muestra los valores reales de múltiples valores p y la potencia en esos valores p. Puede calcular la potencia para diferentes valores de p y tamaños de muestra y luego poner varias líneas en un gráfico

— Peter Flom - Restablecer Monica

Quizás comprobar cómo los tipos de tramas que genera el software G * Power 3 serían buenas para tener ideas sobre qué trazar. Aunque de memoria parecen muy similares a lo que chl y caracal ya han presentado (y no te ayudarían a hacer eso en R).

— Andy W

@Andy G * Las gráficas de potencia inspirada en potencia versus tamaño de efecto o gráficas de potencia versus alfa serían una buena adición. Para el primer caso, un comienzo podría ser esta respuesta , que debería ser fácilmente adaptable al segundo caso.

— caracal

Respuestas:

He jugado con tramas similares y descubrí que funciona mejor cuando las 2 curvas no se bloquean entre sí, sino que están más bien desplazadas verticalmente (pero aún en el mismo eje x). Esto deja en claro que una de las curvas representa la hipótesis nula y la otra representa un valor dado para la media bajo la hipótesis alternativa. La power.exampfunción en el paquete TeachingDemos para R creará estos gráficos y la run.power.exampfunción (mismo paquete) le permite cambiar interactivamente los argumentos y actualizar el gráfico.

— Greg Snow
fuente

+1, una ilustración más completa que la mía. (De hecho, sabía que había algo en el TeachingDemospaquete, pero era demasiado perezoso para buscarlo.)

— CHL

Algunas reflexiones: (a) Use transparencia y (b) Permita cierta interactividad.

Aquí está mi opinión, inspirada en gran medida por un applet de Java sobre errores de tipo I y tipo II: cometer errores en el sistema de justicia . Como este es un código de dibujo bastante puro, lo pegué como la esencia # 1139310 .

Así es como se ve:

ingrese la descripción de la imagen aquí

$H_0$

— chl
fuente

Eso es realmente increíble, nunca había visto un paquete antes.

— Ken Williams

@ Ken Gracias. El aplpackpaquete también tiene algunos buenos complementos para la visualización de datos. Sin embargo, el rpanel , que también se basa en tcl / tk, es probablemente una mejor opción para cosas más complejas. Ahora, con RStudio y el paquete de manipulación , también es fácil mejorar la trama básica en R.

— chl

G Power 3 , software gratuito disponible en Mac y Windows, tiene algunas características gráficas muy buenas para el análisis de energía. El gráfico principal es ampliamente coherente con su gráfico y el que muestra @chl. Utiliza una línea recta simple para indicar hipótesis nulas y distribuciones estadísticas de pruebas de hipótesis alternativas, y colores en beta y alfa en colores separados.

Una buena característica de G Power 3 es que admite una gran cantidad de escenarios comunes de análisis de potencia y la GUI hace que sea fácil de explorar para estudiantes e investigadores aplicados.

Aquí hay una captura de pantalla de una diapositiva (tomada de una presentación que di sobre estadísticas descriptivas con una sección sobre análisis de potencia ) con múltiples de estos gráficos que se muestran a la izquierda. Si elige una versión de prueba t de una cola, se parecería más a su ejemplo.

g potencia 3 gráficos

También es posible producir gráficos que muestren la relación funcional entre los factores relevantes para el poder estadístico y las pruebas de hipótesis (p. Ej., Alfa, tamaño del efecto, tamaño de la muestra, poder, etc.). Presento algunos ejemplos de tales gráficos aquí . Aquí hay un ejemplo de tal gráfico:

ingrese la descripción de la imagen aquí

— Jeromy Anglim
fuente

Paquete interesante, lo miraré en el futuro. Sin embargo, los gráficos parecen un poco complicados para alguien nuevo en el campo. Mi audiencia es MD sin ningún conocimiento matemático o estadístico de fondo. ¡Gracias!

— Max Gordon