En el modelado de ecuaciones estructurales con variables latentes (SEM), una formulación de modelo común es "Indicador múltiple, causa múltiple" (MIMIC) donde una variable latente es causada por algunas variables y reflejada por otras. Aquí hay un ejemplo simple:
Esencialmente, f1
es un resultado de regresión para x1
, x2
y x3
, y y1
, y2
y y3
son indicadores de medición para f1
.
También se puede definir una variable latente compuesta, donde la variable latente básicamente equivale a una combinación ponderada de sus variables constituyentes.
Aquí está mi pregunta: ¿hay alguna diferencia entre definir f1
como un resultado de regresión y definirlo como un resultado compuesto en un modelo MIMIC?
Algunas pruebas con lavaan
software R
muestran que los coeficientes son idénticos:
library(lavaan)
# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))
# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
f1 =~ y1 + y2 + y3
f1 ~ x1 + x2 + x3
'
# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
f1 =~ y1 + y2 + y3
f1 <~ x1 + x2 + x3
'
# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)
# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"
¿Cómo son matemáticamente iguales estos dos modelos? Entiendo que las fórmulas de regresión en un SEM son fundamentalmente diferentes a las fórmulas compuestas, pero este hallazgo parece rechazar esa idea. Además, es fácil encontrar un modelo en el ~
que el operador no sea intercambiable con el <~
operador (para usar lavaan
la sintaxis). Por lo general, usar uno en lugar del otro da como resultado un problema de identificación del modelo, especialmente cuando la variable latente se usa en una fórmula de regresión diferente. Entonces, ¿cuándo son intercambiables y cuándo no?
El libro de texto de Rex Kline (Principios y práctica del modelado de ecuaciones estructurales) tiende a hablar sobre los modelos MIMIC con la terminología de los compuestos, pero Yves Rosseel, el autor de lavaan
, utiliza explícitamente el operador de regresión en cada ejemplo MIMIC que he visto.
¿Alguien puede aclarar este problema?
f1 ~ x1 + x2 + x3
, pero puedes tenerf1 <~ x1 + x2 + x3
?