Primero, presentaré un cuarto modelo para la discusión en mi respuesta:
ajuste1.5 <- lm (y_2 ~ x_1 + x_2 + y_1)
Parte 0
La diferencia entre fit1 y fit1.5 se resume mejor como la diferencia entre una diferencia restringida frente a una diferencia óptima.
Voy a usar un ejemplo más simple para explicar esto que el proporcionado anteriormente. Comencemos con fit1.5. Una versión más simple del modelo sería
Por supuesto, cuando obtengamos una estimación OLS, encontrará la opción "óptima" para . Y, aunque parezca extraño escribir como tal, podríamos reescribir la fórmula como
Podemos pensar en esto como la diferencia "óptima" entre las dos variables .
y2=b0+b1⋅x+b2⋅y1
b2y2−b2⋅y1=b0+b1⋅x
y
Ahora, si decidimos restringir , entonces la fórmula / modelo se convierte en
que es solo la diferencia (restringida).b2=1
y2−y1=b0+b1⋅x
Tenga en cuenta que, en la demostración anterior, si deja que sea una variable dicotómica, y sea una prueba previa y un emparejamiento de puntaje posterior a la prueba, entonces el modelo de diferencia restringida sería solo la muestra independiente test para la ganancia en puntajes , mientras que el modelo de diferencia óptimo sería la prueba ANCOVA con las puntuaciones previas a la prueba que se utilizan como covariables.xy1y2t
Parte 1
El modelo para fit2 puede pensarse mejor de manera similar al enfoque de diferencia utilizado anteriormente. Aunque esto es una simplificación excesiva (ya que a propósito estoy omitiendo los términos de error), el modelo podría presentarse como
donde para los valores de y para los valores de . Aquí está la simplificación excesiva ... esto nos permite escribir
Escrito de otra manera, . Mientras que el modelo fit1.5 tenía como el valor para hacer la diferencia óptima para el análisis OLS, aquí
y=b0+b1⋅x+b2⋅t
t=0y1t=1y2y1y2=b0+b1⋅x=b0+b1⋅x+b2
y2−y1=b2b2b2es esencialmente la diferencia promedio entre los valores (después de controlar las otras covariables).
y
Parte 2
Entonces, ¿cuál es la diferencia entre los modelos fit2 y fit3 ... en realidad, muy poco. El modelo fit3 tiene en cuenta la correlación en términos de error, pero esto solo cambia el proceso de estimación y, por lo tanto, las diferencias entre los dos resultados del modelo serán mínimas (más allá del hecho de que fit3 estima el factor autorregresivo).
Parte 2.5
Y incluiré un modelo más en esta discusión
fit4 <- lmer (y ~ time + x1 + x2 + (1 | id), data = df.long)
Este modelo de efectos mixtos tiene una versión ligeramente diferente del enfoque autorregresivo. Si tuviéramos que incluir el coeficiente de tiempo en los efectos aleatorios, esto sería comparable al cálculo de la diferencia entre las s para cada sujeto. (Pero esto no funcionará ... y el modelo no se ejecutará).y
Holland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.