Probémoslo y veamos si podemos resolverlo. El siguiente ejemplo está codificado R
, que es gratuito y le permitirá reproducir el ejemplo, pero con suerte el código se explica por sí mismo:
group1 = c(1,2,3)
group2 = c(4,5,6,7,8,9)
mean(group1)
# 2
mean(group2)
# 6.5
mean(c(group1, group2))
# 5
mean(c(mean(group1), mean(group2)))
# 4.25
Entonces, lo que vemos es que ciertamente puede calcular la media de las medias, pero la media de las medias y la media de todos los datos sin procesar no coinciden. También podemos probar un promedio ponderado usando la sugerencia de @ BilltheLizard para usar el tamaño de muestra de cada grupo como un peso (los pesos se indican con el w
argumento):
weighted.mean(c(mean(group1), mean(group2)), w=c(3,6))
# 5
Esto ahora nos da la misma respuesta.