Mientras leía un libro de texto sobre regresión me encontré con el siguiente párrafo:
La estimación de mínimos cuadrados de un vector de coeficientes de regresión lineal ( ) es
que, cuando se ve como una función de los datos (considerando los predictores X como constantes), es una combinación lineal de los datos. Usando el Teorema del límite central, se puede demostrar que la distribución de β será aproximadamente multivariada normal si el tamaño de la muestra es grande.
Definitivamente me falta algo del texto, pero no entiendo cómo puede un solo valor tener una distribución. ¿Cómo se generan los múltiples valores β para obtener la distribución mencionada en el texto?
44
es el vector de los coeficientes de regresión, ¿eso aclara la confusión?
—
Macro
@ Taylor Pero, ¿cómo sabe la distribución de B si lo único que sé es que el "tamaño de la muestra es grande"?
—
encima
@Taylor El componente individual del beta vactor tendrá una distribución solo si el componente de error en el modelo de regresión es gaussiano con 0 media y varianza constante. En el caso no normal, no necesariamente conocería su distribución bajo la hipótesis nula, pero aún puede ser asintóticamente normal. Sin embargo, como dice Whuber, el teorema del límite central puede no ser válido porque es un promedio ponderado y necesitamos saber que los pesos no cambian con el tamaño de la muestra de una manera que permita que algunos términos dominen la suma.
—
Michael R. Chernick