Sí, podemos obtener un resultado análogo utilizando la media y la varianza de la muestra, y tal vez surjan algunas sorpresas en el proceso.
Primero, necesitamos refinar un poco el enunciado de la pregunta y establecer algunas suposiciones. Es importante destacar que debe quedar claro que no podemos esperar reemplazar la varianza de la población con la varianza de la muestra en el lado derecho ya que esta última es aleatoria . Entonces, reenfocamos nuestra atención en la desigualdad equivalente
En caso de que no esté claro que estos son equivalentes, tenga en cuenta que simplemente hemos reemplazado t con t σ en la desigualdad original sin ninguna pérdida en general.
P(X−EX≥tσ)≤11+t2.
ttσ
En segundo lugar, suponemos que tenemos una muestra aleatoria estamos interesados en un límite superior para la cantidad análoga
P ( X 1 - ˉ X ≥ t S ) , donde ˉ X es la media de la muestra y S es la desviación estándar de la muestra.X1, ... , XnorteP ( X1- X¯≥ t S)X¯S
Un medio paso adelante
Tenga en cuenta que al aplicar la desigualdad original de Chebyshev unilateral a , obtenemos que
P ( X 1 - ˉ X ≥ t σ ) ≤ 1X1- X¯
dondeσ2=Var(X1), que esmás pequeñoque el lado derecho de la versión original. ¡Esto tiene sentido! Cualquier realización particular de una variable aleatoria de una muestra tenderá a estar (ligeramente) más cerca de la media de la muestra a la que contribuye que de la media de la población. Como veremos a continuación, reemplazaremosσporSbajo supuestos aún más generales.
P ( X1- X¯≥ t σ) ≤ 11 + nn - 1t2
σ2= V a r ( X1)σS
Una versión de muestra de Chebyshev unilateral
Reclamación : Sea una muestra aleatoria tal que P ( S = 0 ) = 0 . Entonces, P ( X 1 - ˉ X ≥ t S ) ≤ 1X1, ... , XnorteP (S= 0 ) = 0En particular, la versión de muestra del límite esmás estrictaque la versión original de la población.
P ( X1- X¯≥ t S) ≤ 11 + nn - 1t2.
Nota : Nosotros no asumir que el tiene media o la varianza finita, ya sea!Xyo
Prueba . La idea es adaptar la prueba de la desigualdad original de Chebyshev unilateral y emplear simetría en el proceso. Primero, configure por conveniencia de notación. Luego, observe que
P ( Y 1 ≥ t S ) = 1Yyo= Xyo- X¯
P ( Y1≥ t S) = 1norte∑i = 1norteP ( Yyo≥ t S) = E 1norte∑i = 1norte1( Yyo≥ t S).
Ahora, para cualquier , en { S > 0 } ,
1 ( Y i ≥ t S ) = 1 ( Y i + t c S ≥ t S ( 1 + c ) ) ≤ 1 ( ( Y i + t c S ) 2 ≥ t 2 ( 1 + c ) 2 S 2c > 0{ S> 0 }
1( Yyo≥ t S)= 1( Yyo+ t c S≥ t S( 1 + c ) )≤ 1((Yi+tcS)2≥t2(1+c)2S2)≤(Yi+tcS)2t2(1+c)2S2.
Entonces
1n∑i1(Yi≥tS)≤1n∑i(Yi+tcS)2t2(1+c)2S2=(n−1)S2+nt2c2S2nt2(1+c)2S2=(n−1)+nt2c2nt2(1+c)2,
Y¯= 0∑yoY2yo= ( n - 1 ) S2
P ( X1- X¯≥ t S) ≤ ( n - 1 ) + n t2do2n t2( 1 + c )2.
doc = n - 1n t2
Esa molesta condición técnica
P (S= 0 ) = 0S20 = Yyo= t S= 0it>0
q=P(S=0)
q=P(S=0)>0
P(X1−X¯≥tS)≤(1−q)11+nn−1t2+q.
{S>0}{S=0}{S>0}= 0 } es trivial
Una desigualdad ligeramente más limpia resulta si reemplazamos la desigualdad no estricta en la declaración de probabilidad con una versión estricta.
Corolario 2 . Dejarq= P ( S= 0 )(posiblemente cero). Luego,
P ( X1- X¯> t S) ≤ ( 1 - q) 11 + nn - 1t2.
Comentario final : la versión de muestra de la desigualdad no requería suposiciones sobreX(aparte de que no sea constante casi seguramente en el caso desigualdad no estricta, que la versión original también asume tácitamente), en esencia, porque la muestra de la media y la muestra de varianza siempre existe o no sus análogos población sí.