Para cualquier número con media
, la varianza viene dada por
Aplicar para el conjunto dado de números
que tomamos por conveniencia en la exposición para tener media , tenemos que
y 1 , y 2 , ... , y N ˉ y = 1nortey1, y2, ... , ynorte σ 2y¯= 1norte∑i = 1norteyyo(1)nx1,x2,…xnˉx=0σ2=1
σ2σ2= 1norte- 1∑i = 1norte( yyo- y¯)2= 1norte- 1∑i = 1norte( y2yo- 2 yyoy¯+ y¯2)= 1norte- 1[ ( ∑i = 1nortey2yo) -2N( y¯)2+ N( y¯)2]= 1norte- 1∑i = 1norte( y2yo- ( y¯)2)(1)
( 1 )norteX1, x2, ... xnorteX¯= 0 xn+11σ2= 1n - 1∑i = 1norte( x2yo- ( x¯)2) = 1n - 1∑i = 1norteX2yo
Si ahora agregamos una nueva observación a este conjunto de datos, entonces la nueva media del conjunto de datos es
mientras que la nueva varianza es
Entoncesnecesita ser más grande que
Xn + 1σ 21n + 1∑i = 1n + 1Xyo= n x¯+ xn + 1n + 1= xn + 1n + 1
El | xn+1| σ√σ^2= 1norte∑i = 1n + 1( x2yo- x2n + 1( n + 1 )2)= 1norte[ ( ( n - 1 ) σ2+ x2n + 1) - x2n + 1n + 1]=1norte[ (n-1) σ2+ nn + 1X2n + 1]> σ2 solo si x 2n + 1> n + 1norteσ2.
El | Xn + 1El | xn+1ˉxσ√σ1 + 1norte-----√
o, más generalmente, necesita diferir de la media del conjunto de datos original en más de , para que el conjunto de datos aumentados tenga una varianza mayor que el conjunto de datos original. Véase también la respuesta de Ray Koopman, que señala que la nueva varianza es mayor, igual o menor que la varianza original según
difiere de la media en más que, exactamente o menos que .
Xn + 1X¯ xn+1σ√σ1 + 1norte-----√Xn + 1σ1 + 1norte-----√