La variación ponderada imparcial ya se abordó aquí y en otros lugares, pero todavía parece haber una sorprendente cantidad de confusión. Parece haber un consenso hacia la fórmula presentada en el primer enlace, así como en el artículo de Wikipedia . Esto también se parece a la fórmula utilizada por R, Mathematica y GSL (pero no MATLAB). Sin embargo, el artículo de Wikipedia también contiene la siguiente línea que parece un gran control de cordura para una implementación de variación ponderada:
Por ejemplo, si los valores {2,2,4,5,5,5} se extraen de la misma distribución, entonces podemos tratar este conjunto como una muestra no ponderada, o podemos tratarlo como la muestra ponderada {2,4, 5} con los pesos correspondientes {2,1,3}, y deberíamos obtener los mismos resultados.
Mis cálculos dan el valor de 2.1667 para la varianza de los valores originales y 2.9545 para la varianza ponderada. ¿Realmente debería esperar que sean lo mismo? ¿Por qué o por qué no?