Vale la pena tener claro el propósito de su trama. En general, hay dos tipos diferentes de objetivos: puede hacer gráficos para usted mismo para evaluar los supuestos que está haciendo y guiar el proceso de análisis de datos, o puede hacer gráficos para comunicar un resultado a los demás. Estos no son lo mismo; por ejemplo, muchos espectadores / lectores de su trama / análisis pueden ser estadísticamente poco sofisticados y pueden no estar familiarizados con la idea de, por ejemplo, la varianza igual y su papel en una prueba t. Desea que su trama transmita la información importante sobre sus datos incluso a consumidores como ellos. Están confiando implícitamente en que has hecho las cosas correctamente. De la configuración de su pregunta, supongo que está detrás del último tipo.
Siendo realistas, el gráfico más común y aceptado para comunicar los resultados de una prueba t 1 a otros (dejando de lado si es realmente el más apropiado) es un gráfico de barras de medias con barras de error estándar. Esto coincide muy bien con la prueba t porque una prueba t compara dos medios usando sus errores estándar. Cuando tiene dos grupos independientes, esto generará una imagen intuitiva, incluso para los que no son estadísticamente sofisticados, y las personas (que deseen datos) pueden "ver de inmediato que probablemente son de dos poblaciones diferentes". Aquí hay un ejemplo simple usando los datos de @ Tim:
nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se = c(sd(nonsmokers)/sqrt(length(nonsmokers)),
sd(smokers)/sqrt(length(smokers)))
windows()
bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
box()
arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)
Dicho esto, los especialistas en visualización de datos suelen despreciar estas tramas. A menudo se los ridiculiza como "diagramas de dinamita" (cf. Por qué los diagramas de dinamita son malos ) En particular, si solo tiene unos pocos datos, a menudo se recomienda que simplemente muestre los datos ellos mismos . Si los puntos se superponen, puede fluctuarlos horizontalmente (agregue una pequeña cantidad de ruido aleatorio) para que ya no se superpongan. Debido a que una prueba t es fundamentalmente sobre las medias y los errores estándar, es mejor superponer las medias y los errores estándar en dicho gráfico. Aquí hay una versión diferente:
set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE,
xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)
Si tiene muchos datos, los diagramas de caja pueden ser una mejor opción para obtener una visión general rápida de las distribuciones, y también puede superponer los medios y los SE allí.
data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see
Las gráficas simples de los datos, y las gráficas de caja, son lo suficientemente simples como para que la mayoría de las personas puedan comprenderlas incluso si no son muy conocedoras de las estadísticas. Sin embargo, tenga en cuenta que ninguno de estos facilita la evaluación de la validez de haber utilizado una prueba t para comparar sus grupos. Esos objetivos se cumplen mejor con diferentes tipos de tramas.
1. Tenga en cuenta que esta discusión supone una prueba t de muestras independientes. Estas gráficas podrían usarse con una prueba t de muestras dependientes, pero también podrían ser engañosas en ese contexto (cf. ¿Está mal el uso de barras de error para las medias en un estudio dentro de los sujetos? ).