¿Cuál es la diferencia entre un factor MIMIC y un compuesto con indicadores (SEM)?

En el modelado de ecuaciones estructurales con variables latentes (SEM), una formulación de modelo común es "Indicador múltiple, causa múltiple" (MIMIC) donde una variable latente es causada por algunas variables y reflejada por otras. Aquí hay un ejemplo simple:

Esencialmente, f1es un resultado de regresión para x1, x2y x3, y y1, y2y y3son indicadores de medición para f1.

También se puede definir una variable latente compuesta, donde la variable latente básicamente equivale a una combinación ponderada de sus variables constituyentes.

Aquí está mi pregunta: ¿hay alguna diferencia entre definir f1como un resultado de regresión y definirlo como un resultado compuesto en un modelo MIMIC?

Algunas pruebas con lavaansoftware Rmuestran que los coeficientes son idénticos:

library(lavaan)

# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))

# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
    f1 =~ y1 + y2 + y3
    f1 ~ x1 + x2 + x3
'

# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
    f1 =~ y1 + y2 + y3
    f1 <~ x1 + x2 + x3
'

# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)

# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"

¿Cómo son matemáticamente iguales estos dos modelos? Entiendo que las fórmulas de regresión en un SEM son fundamentalmente diferentes a las fórmulas compuestas, pero este hallazgo parece rechazar esa idea. Además, es fácil encontrar un modelo en el ~que el operador no sea intercambiable con el <~operador (para usar lavaanla sintaxis). Por lo general, usar uno en lugar del otro da como resultado un problema de identificación del modelo, especialmente cuando la variable latente se usa en una fórmula de regresión diferente. Entonces, ¿cuándo son intercambiables y cuándo no?

El libro de texto de Rex Kline (Principios y práctica del modelado de ecuaciones estructurales) tiende a hablar sobre los modelos MIMIC con la terminología de los compuestos, pero Yves Rosseel, el autor de lavaan, utiliza explícitamente el operador de regresión en cada ejemplo MIMIC que he visto.

¿Alguien puede aclarar este problema?

sem latent-variable lavaan

— dmp
fuente

Son del mismo modelo.

Es útil poder definir una variable latente como un resultado compuesto donde esa variable solo tiene indicadores compuestos.

Si no tienes:

f1 =~ y1 + y2 + y3

No puedes poner:

f1 ~ x1 + x2 + x3

Pero puedes tener:

f1 <~ x1 + x2 + x3

— Jeremy Miles
fuente

¡Gracias! ¿Podrías aclarar por qué no puedes tener f1 ~ x1 + x2 + x3, pero puedes tener f1 <~ x1 + x2 + x3?

— dmp

Porque en primera instancia, f1 aún no es una variable en el modelo, porque está latente, debe definirlo.

— Jeremy Miles

Si tenía tal modelo, tenía que usar un truco como f1 = ~ 0 * x1 para tener una var latente, que luego puede usar en f ~ x1 + x2 + x3.

— Jeremy Miles