Para comprender por qué usamos la distribución t, debe saber cuál es la distribución subyacente de y de la suma residual de cuadrados ( ), ya que estos dos juntos le darán la distribución t. RSSβˆRSS
La parte más fácil es la distribución de que es una distribución normal, para ver esta nota que = entonces es una función lineal de donde . Como resultado, también se distribuye normalmente, - avíseme si necesita ayuda derivando la distribución de . β (XTX)-1XTYYY~N(Xβ,σ2In) β ~N(β,σ2(XTX)-1) ββˆβˆ(XTX)−1XTYYY∼N(Xβ,σ2In)βˆ∼N(β,σ2(XTX)−1)βˆ
Además, , donde es el número de observaciones y es el número de parámetros utilizados en su regresión. La prueba de esto es un poco más complicada, pero también es fácil de deducir (vea la prueba aquí ¿Por qué se distribuye RSS chi cuadrado por np? ). n pRSS∼σ2χ2n−pnp
Hasta este punto, he considerado todo en notación matricial / vectorial, pero para simplificar usemos y usemos su distribución normal que nos dará:
β i-βiβˆi
βˆi−βiσ(XTX)−1ii−−−−−−−−√∼N(0,1)
Además, a partir de la distribución chi-cuadrado de tenemos que:
RSS
(n−p)s2σ2∼χ2n−p
Esto fue simplemente una reorganización de la primera expresión de chi-cuadrado y es independiente de la . Además, definimos , que es un estimador imparcial para . Por la definición de la definición que dividir una distribución normal por un chi-cuadrado independiente (sobre sus grados de libertad) le da una distribución t (para la prueba vea: Una normal dividida por el te da una distribución t - prueba ) obtienes eso:N(0,1)s2=RSSn−pσ2tn−pχ2(s)/s−−−−−−√
βˆi−βis(XTX)−1ii−−−−−−−−√∼tn−p
Donde .s(XTX)−1ii−−−−−−−−√=SE(βˆi)
Avísame si tiene sentido.