¿Hay alguna manera de usar la matriz de covarianza para encontrar coeficientes de regresión múltiple?

Para la regresión lineal simple, el coeficiente de regresión es calculable directamente a partir de la matriz de varianza-covarianza $C$ , por

\frac{C_{d, e}}{C_{e, e}}

$C_{d, e}\over C_{e,e}$ donde

d

$d$ es el índice de la variable dependiente, y

e

$e$ es el índice de la variable explicativa.

Si uno solo tiene la matriz de covarianza, ¿es posible calcular los coeficientes para un modelo con múltiples variables explicativas?

ETA: para dos variables explicativas, parece que y análogamente para. No veo de inmediato cómo extender esto a tres o más variables.

β_{1} = \frac{C o v (y, x_{1}) v a r (x_{2}) - C o v (y, x_{2}) C o v (x_{1}, x_{2})}{v a r (x_{1}) v a r (x_{2}) - C o v (x_{1}, x_{2})^{2}}

$\beta_1 = \frac{Cov(y,x_1)var(x_2) - Cov(y,x_2)Cov(x_1,x_2)}{var(x_1)var(x_2) - Cov(x_1,x_2)^2}$

β_{2}

$\beta_2$

regression regression-coefficients covariance-matrix

— David
fuente

El coeficiente de vector

es la solución a

. Algunas manipulaciones algebraicas revelan que, de hecho, esto es lo mismo que la fórmula que se da en el caso del coeficiente 2. Presentado muy bien aquí: stat.purdue.edu/~jennings/stat514/stat512notes/topic3.pdf . No estoy seguro si eso ayuda en absoluto. Pero me aventuraría a adivinar que esto es imposible en general en base a esa fórmula.

\hat{β}

$\hat{\beta}$

X^{'} Y = (X^{'} X)^{- 1} β

$X'Y=(X'X)^{-1}\beta$

— shadowtalker

@David ¿Has descubierto cómo extender esto a un número arbitrario de variables explicativas (más allá de 2)? Necesito la expresion.

— Jane Wayne

@JaneWayne No estoy seguro de entender su pregunta: whuber dio la solución a continuación en forma de matriz,

C^{- 1} (Cov (X_{i}, y))^{'}

$C^{-1}(\text{Cov}(X_i, y))^\prime$

— David

Sí, lo estudié y tiene razón.

— Jane Wayne

Sí, la matriz de covarianza de todas las variables, explicativa y de respuesta, contiene la información necesaria para encontrar todos los coeficientes, siempre que se incluya un término de intercepción (constante) en el modelo. (Aunque las covarianzas no proporcionan información sobre el término constante, se puede encontrar a partir de los medios de los datos).

Análisis

Dejar que los datos para las variables explicativas pueden organizar como vectores columna -dimensional y la variable de respuesta sean el vector columna , considerado como una realización de una variable aleatoria . Los ordinarios estimaciones de mínimos cuadrados de los coeficientes en el modelo $n$ $x_1, x_2, \ldots, x_p$ $y$ $Y$ $\hat\beta$

E (Y) = α + X β

$\mathbb{E}(Y) = \alpha + X\beta$

se obtienen ensamblando los vectores de columna en una matriz y resolviendo el sistema de ecuaciones lineales $p+1$ $X_0 = (1, 1, \ldots, 1)^\prime, X_1, \ldots, X_p$ $n \times p+1$ $X$

X^{'} X \hat{β} = X^{'} y .

$X^\prime X \hat\beta = X^\prime y.$

Es equivalente al sistema

\frac{1}{n} X^{'} X \hat{β} = \frac{1}{n} X^{'} y .

$\frac{1}{n}X^\prime X \hat\beta = \frac{1}{n}X^\prime y.$

La eliminación gaussiana resolverá este sistema. Se procede por contigua a la de la matriz $p+1\times p+1$ y el-vector $\frac{1}{n}X^\prime X$ $p+1$ en unamatrizy reduciéndola por filas. $\frac{1}{n}X^\prime y$ $p+1 \times p+2$ $A$

El primer paso inspeccionará . Al encontrar que esto no es cero, procede a restar los múltiplos apropiados de la primera fila dede las filas restantes para poner a cero las entradas restantes en su primera columna. Estos múltiplos serán $\frac{1}{n}(X^\prime X)_{11} = \frac{1}{n}X_0^\prime X_0 = 1$ $A$ y el número restado de la entradaserá igual a. Esta es solo la fórmula para la covarianza dey. Además, el número que queda en la posiciónes igual a $\frac{1}{n}X_0^\prime X_i = \overline X_i$ $A_{i+1,j+1} = X_i^\prime X_j$ $\overline X_i \overline X_j$ $X_i$ $X_j$ $i+1, p+2$ , la covarianza decon. $\frac{1}{n}X_i^\prime y - \overline{X_i}\overline{y}$ $X_i$ $y$

Por lo tanto, después del primer paso de eliminación gaussiana, el sistema se reduce a la resolución

C \hat{β} = (Cov (X_{i}, y))^{'}

$C\hat{\beta} = (\text{Cov}(X_i, y))^\prime$

y obviamente, dado que todos los coeficientes son covarianzas, esa solución se puede encontrar a partir de la matriz de covarianza de todas las variables.

(Cuando es invertible, la solución se puede escribir . Las fórmulas dadas en la pregunta son casos especiales de esto cuando y Escribir estas fórmulas explícitamente se vuelven más y más complejos a medida que crece Además, son inferiores para el cómputo numérico, que se realiza mejor resolviendo el sistema de ecuaciones en lugar de invertir la matriz ). $C$ $C^{-1}(\text{Cov}(X_i, y))^\prime$ $p=1$ $p=2$ $p$ $C$

$y$ $X\hat{\beta}$

Ejemplo

Para ilustrar, el siguiente Rcódigo crea algunos datos, calcula sus covarianzas y obtiene las estimaciones de coeficientes de mínimos cuadrados únicamente a partir de esa información. Los compara con las estimaciones obtenidas del estimador de mínimos cuadrados lm.

#
# 1. Generate some data.
#
n <- 10        # Data set size
p <- 2         # Number of regressors
set.seed(17)
z <- matrix(rnorm(n*(p+1)), nrow=n, dimnames=list(NULL, paste0("x", 1:(p+1))))
y <- z[, p+1]
x <- z[, -(p+1), drop=FALSE]; 
#
# 2. Find the OLS coefficients from the covariances only.
#
a <- cov(x)
b <- cov(x,y)
beta.hat <- solve(a, b)[, 1]  # Coefficients from the covariance matrix
#
# 2a. Find the intercept from the means and coefficients.
#
y.bar <- mean(y)
x.bar <- colMeans(x)
intercept <- y.bar - x.bar %*% beta.hat

El resultado muestra un acuerdo entre los dos métodos:

(rbind(`From covariances` = c(`(Intercept)`=intercept, beta.hat),
       `From data via OLS` = coef(lm(y ~ x))))

                  (Intercept)        x1        x2
From covariances     0.946155 -0.424551 -1.006675
From data via OLS    0.946155 -0.424551 -1.006675

— whuber
fuente

Gracias, @whuber! Esto es exactamente lo que estaba buscando, y mi cerebro atrofiado no pudo llegar. Por otro lado, la motivación para la pregunta es que, por varias razones, esencialmente no tenemos el pleno

X

$X$ disponible, pero tener cov(z)de cálculos anteriores.

— David

Respuestas como esta elevan el listón de esta Cruz Validado

— jpmuc

@whuber En su ejemplo, calculó la intercepción de yy xy beta.hat. Los yy xson parte de los datos originales. ¿Es posible derivar la intersección de la matriz de covarianza y las medias solas? ¿Podría por favor proporcionar la notación?

— Jane Wayne

@Jane Dado solo los medios

\bar{X}

$\bar X$ , aplicar

\hat{β}

$\hat \beta$ a ellos:

\bar{X} \hat{β} = \bar{X \hat{β}} .

$\overline X \hat\beta = \overline{X \hat\beta}.$ He cambiado el código para reflejar esto.

— whuber

+1 muy útil para el código

— Michael