Su pregunta vinculada es abordar el uso de pesos como un atajo para lidiar con la varianza igualmente ponderada por punto de datos en la que algunos puntos de datos ocurren más de una vez.
@whuber ha abordado en un comentario la situación en la que las variaciones de todos los puntos de datos son iguales. Así que abordaré la situación en la que no son iguales. En esta situación, la media ponderada óptima produce una varianza menor que la media no ponderada, es decir, igualmente ponderada.
La media ponderada, usando pesas wyo, es igual Σnortei = 1wyoXyoy tiene varianza = Σnortei = 1w2yoVa r (Xyo). Entonces deseamos minimizarΣnortei = 1w2yoVa r (Xyo), sujeto a Σnortei = 1wyo= 1 y wyo≥ 0 por todo lo i.
Las condiciones de Karush-Kuhn-Tucker, que son necesarias y suficientes para un mínimo global para este problema, dado que es un problema de programación cuadrática convexo, dan como resultado una solución de forma cerrada, a saber:
Lo óptimo wyo= [ 1 / Va r (Xyo) ] /Σnortej = 1[ 1 / Va r (Xj) ] para 1 = 1 .. n.
La varianza de la media ponderada óptima correspondiente = 1 /Σnortei = 1[ 1 / Va r (Xyo) ].
Por el contrario, igual ponderación significa wyo=1nortepara todo i, donde n es el número de puntos de datos. Como señaló Whuber, los pesos iguales son óptimos si todas las variaciones de puntos de datos son iguales, lo que se puede ver en la fórmula anterior para un óptimowyo. Sin embargo, como es evidente por esa fórmula, los pesos iguales no son óptimos si las variaciones de los puntos de datos no son todas iguales, y de hecho resultan en una varianza mayor (de la media ponderada) que los pesos óptimos. La varianza de la media ponderada por igual, es decir, la varianza de la media ponderada usando pesos iguales =1norte2Σnortei = 1Va r (Xyo).
Aquí hay algunos ejemplos de resultados numéricos:
- Hay dos puntos de datos, que tienen variaciones respectivamente de 1 y 4. La media no ponderada tiene una varianza = 1.25. La media ponderada que usa los pesos óptimos de 0.8 y 0.2 respectivamente, tiene una varianza = 0.8, que por supuesto es menor que 1.25.
- Hay tres puntos de datos, que tienen varianzas respectivamente de 1, 4 y 9. La media no ponderada tiene varianza = 1.5556. La media ponderada utilizando los pesos óptimos de 0.7347, 0.1837, 0.0816 respectivamente, tiene una varianza = 0.7347, que por supuesto es menor que 1.5556.
Por supuesto, es posible que la media ponderada tenga una mayor varianza que la media no ponderada, si las ponderaciones se eligen de manera deficiente. Al elegir el peso de 1 en el punto de datos con la mayor varianza, y 0 para todos los demás puntos de datos, la media ponderada tendría varianza = la mayor varianza de cualquier punto de datos. Este ejemplo extremo sería el resultado de maximizar en lugar de minimizar en el problema de optimización que expuse.