En general, el error estándar le dice cuán incierto es que el verdadero valor de la parte superior de la barra es donde la barra dice que está. Cuando hay varias barras, también puede permitir comparaciones entre barras, en el sentido de una prueba estadística. Sin embargo, interpretarlos de esta manera requiere algunos supuestos, que se muestran gráficamente a continuación. Si está realmente interesado en comparar las barras para ver si las diferencias son estadísticamente significativas, entonces debe ejecutar pruebas en los datos y mostrar qué pruebas fueron significativas, como esta.
Además, sugeriría usar intervalos de confianza en lugar de errores estándar.
Vale la pena leer este artículo:
Cumming y Finch. "Inferencia por ojo: intervalos de confianza y cómo leer imágenes de datos". Am Psych. Vol. 60, N ° 2, 170-180.
Su conclusión general es: "Busque barras que se relacionen directamente con los efectos de interés, sean sensibles al diseño experimental e interpreten los intervalos".
Para muestras independientes, utilizando intervalos de confianza, la mitad de la superposición de los IC significa que la diferencia es estadísticamente significativa.
Para muestras independientes que utilizan barras de error estándar, el siguiente gráfico muestra cómo calcular la significación estadística: