La geometría proporciona información y las desigualdades clásicas permiten un fácil acceso al rigor.
Solución geométrica
Sabemos, por la geometría de los mínimos cuadrados , que es la proyección ortogonal del vector de datos x = ( x 1 , x 2 , ... , x n ) sobre El subespacio lineal generado por el vector constante ( 1 , 1 , ... , 1 ) y que σ xx¯=(x¯,x¯,…,x¯)x=(x1,x2,…,xn)(1,1,…,1)σxes directamente proporcional a la distancia (euclidiana) entre y ˉ x . Las restricciones de no negatividad son lineales y la distancia es una función convexa, por lo que los extremos de la distancia deben alcanzarse en los bordes del cono determinados por las restricciones. Este cono es el orante positivo en R n y sus bordes son los ejes de coordenadas, de donde se deduce inmediatamente que todos menos uno de los x i deben ser cero en las distancias máximas. Para tal conjunto de datos, un cálculo directo (simple) muestra σ x / ˉ x = √xx¯.Rnxiσx/x¯=n−−√.
Solución que explota las desigualdades clásicas
se optimiza simultáneamente con cualquier transformación monotónica de los mismos. A la luz de esto, maximicemosσx/x¯
x21+x22+…+x2n(x1+x2+…+xn)2=1n(n−1n(σxx¯)2+1)=f(σxx¯).
(La fórmula para puede parecer misteriosa hasta que se dé cuenta de que solo registra los pasos que se tomarían al manipular algebraicamente σ x / ˉ x para obtener una forma de aspecto simple, que es el lado izquierdo).fσx/x¯
Una manera fácil comienza con la desigualdad de Holder ,
x21+x22+…+x2n≤(x1+x2+…+xn)max({xi}).
(Esto no necesita una prueba especial en este contexto simple: simplemente reemplace un factor de cada término por el componente máximo max ( { x i } ) : obviamente la suma de los cuadrados no disminuirá. el término común max ( { x i } ) produce el lado derecho de la desigualdad).x2i=xi×ximax({xi})max({xi})
Debido a que no son todos 0 (eso dejaría σ x / ˉ x indefinido), la división por el cuadrado de su suma es válida y da la desigualdad equivalentexi0σx/x¯
x21+x22+…+x2n(x1+x2+…+xn)2≤max({xi})x1+x2+…+xn.
Debido a que el denominador no puede ser menor que el numerador (que en sí mismo es solo uno de los términos en el denominador), el lado derecho está dominado por el valor , que se logra solo cuando todos menos uno de x i son iguales a 0 . De dónde1xi0
σxx¯≤f−1(1)=(1×(n−1))nn−1−−−−−−−−−−−−−−−√=n−−√.
Enfoque alternativo
Dado que no es negativo y no puede sumar 0 , los valores p ( i ) = x i / ( x 1 + x 2 + … + x n ) determinan una distribución de probabilidad F en { 1 , 2 , … , n } . Escribiendo s para la suma de x i , reconocemosxi0p(i)=xi/(x1+x2+…+xn)F{1,2,…,n}sxi
x21+x22+…+x2n(x1+x2+…+xn)2=x21+x22+…+x2ns2=(x1s)(x1s)+(x2s)(x2s)+…+(xns)(xns)=p1p1+p2p2+…+pnpn=EF[p].
El hecho axiomático de que ninguna probabilidad puede exceder implica que esta expectativa tampoco puede exceder 1 , pero es fácil hacerlo igual a 1 estableciendo que todos menos uno de los p i sean iguales a 0 y, por lo tanto, exactamente uno de los x i no es cero. Calcule el coeficiente de variación como en la última línea de la solución geométrica anterior.111pi0xi