En mi área de investigación, una forma popular de mostrar datos es usar una combinación de un gráfico de barras con "barras de control". Por ejemplo,
Las "barras de control" alternan entre errores estándar y desviaciones estándar según el autor. Por lo general, los tamaños de muestra para cada "barra" son bastante pequeños, alrededor de seis.
Estas parcelas parecen ser particularmente populares en las ciencias biológicas; consulte los primeros documentos de BMC Biology, vol 3 para ver ejemplos.
Entonces, ¿cómo presentarías estos datos?
¿Por qué no me gustan estas tramas?
Personalmente no me gustan estas tramas.
- Cuando el tamaño de la muestra es pequeño, ¿por qué no solo mostrar los puntos de datos individuales?
- ¿Se está mostrando el SD o el SE? Nadie acepta cuál usar.
- ¿Por qué usar barras en absoluto? Los datos (generalmente) no van de 0, pero un primer paso en el gráfico sugiere que sí.
- Los gráficos no dan una idea sobre el rango o el tamaño de la muestra de los datos.
R script
Este es el código R que utilicé para generar la trama. De esa manera puede (si lo desea) usar los mismos datos.
#Generate the data
set.seed(1)
names = c("A1", "A2", "A3", "B1", "B2", "B3", "C1", "C2", "C3")
prevs = c(38, 37, 31, 31, 29, 26, 40, 32, 39)
n=6; se = numeric(length(prevs))
for(i in 1:length(prevs))
se[i] = sd(rnorm(n, prevs, 15))/n
#Basic plot
par(fin=c(6,6), pin=c(6,6), mai=c(0.8,1.0,0.0,0.125), cex.axis=0.8)
barplot(prevs,space=c(0,0,0,3,0,0, 3,0,0), names.arg=NULL, horiz=FALSE,
axes=FALSE, ylab="Percent", col=c(2,3,4), width=5, ylim=range(0,50))
#Add in the CIs
xx = c(2.5, 7.5, 12.5, 32.5, 37.5, 42.5, 62.5, 67.5, 72.5)
for (i in 1:length(prevs)) {
lines(rep(xx[i], 2), c(prevs[i], prevs[i]+se[i]))
lines(c(xx[i]+1/2, xx[i]-1/2), rep(prevs[i]+se[i], 2))
}
#Add the axis
axis(2, tick=TRUE, xaxp=c(0, 50, 5))
axis(1, at=xx+0.1, labels=names, font=1,
tck=0, tcl=0, las=1, padj=0, col=0, cex=0.1)