OLS en términos de medias y tamaño de muestra


8

Dado un modelo:

y=β0 0+β1F+tu

Donde es ficticio si es hembra y caso contrario, y es altura en cm. El tamaño de la muestra es en total. Además y . Calcular las estimaciones de los parámetros.F=10 0norteFmimetrounalmi=nortemetrounalmi=100200y¯metrounalmi=175y¯Fmimetrounalmi=165

Mi intento:

Usando la fórmula bien conocida:

β^=(XX)-1Xy
obtengo:
[200100100100]-1[170200165200]

Primero, los elementos en (XX)-1 , dado que X es solo un grupo, hay 100 hembras en la muestra y hay 200 machos y hembras en total. Para Xy , el primer elemento es la "gran media" de 170, y el segundo es solo la media de la muestra de estatura para las mujeres. Ambos están escalados en 200, ya que no "reduje" (XX)-1 .

Es la correcta? Pregunto, porque la solución (al multiplicar) da como resultado algunos (muy) impares números.

Respuestas:


7

El enfoque es correcto, pero hay un ligero error numérico: solo hay mujeres, no . Las alturas medias para hombres y mujeres se pueden convertir en sumas a través de100200

Suma de alturas masculinas=100×175

y

Suma de alturas femeninas=100×165.

Por lo tanto, la suma de todas las alturas es

Suma de todas las alturas=100×175+100×165=200×170,

como se indica en la pregunta. En consecuencia, las ecuaciones normales son

(200100100100)(β^0 0β^1)=(200170100165)

( no en el lado derecho), con solución165200

(β^0 0,β^1)=(175,-10).

Qué error más tonto ...
Repmat

1
No lo llamaría tonto. Es algo natural que hacer. Tuve que mirar la pregunta durante un par de minutos antes de que el problema se hiciera evidente ...
whuber

1

Estoy bastante confundido. Que decir ¿Son estos residuos? Si es así, entoncestu

XX =[200100100100]

ya que

X=yβ=[y1β1y2β1...ynorteFβ1ynorteF+1β1ynorteF+2β1...ynortenorteF+nortemetroβ1y1β2y2β2...ynorteFβ2ynorteF+1β2ynorteF+2β2...ynortenorteF+nortemetroβ2]T

=

[11...111...10 00 0...0 011...1]T

Algunos pensamientos:

Dada su ecuación mi opinión debería ser 175 y = -10. Entonces, para la parte masculina y femenina obtienes:β1β2

Fmetro=175(+)-10×0 0+tu=175+tu

FF=175(+)-10×1+tu=165+tu

Ya que puedes usar

β=(XX)-1XTy

para resolver usando el pseudoinverso de Moore-Penrose .β

((XX)-1XT)+β=((XX)-1XT)+[175-10]=y

Ahora contiene:y

y[165F1165F2...165F100175metro1175metro2...175metro100]T

¡Espero eso ayude!


55
Mientras que los estadísticos usualmente usan bajo el nombre de Error para la parte no explicada del modelo, los economometristas frecuentemente hablan de Error, Choques (transitorios) o Perturbación. Es solo una notación habitual. ϵtu
mugen

1
@nali, ¿puedes agregar un poco a esto? Dados sus números, la solución del sistema no tiene sentido. Y sí, ustedes son los residuos.
Repmat

@Repmat: Actualicé algunas ideas que tenía inicialmente. Espero eso ayude.
nali

@Repmat: Quizás me entendiste mal. X '* y no es [170 82.5] ^ T
nali
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.