Estoy un poco confundido acerca de las ventajas de los modelos mixtos con respecto al modelado predictivo. Dado que los modelos predictivos generalmente están destinados a predecir valores de observaciones previamente desconocidas, me parece obvio que la única forma en que un modelo mixto puede ser útil es a través de su capacidad para proporcionar predicciones a nivel de población (sin agregar ningún efecto aleatorio). Sin embargo, el problema es que hasta ahora, en mi experiencia, las predicciones a nivel de población basadas en modelos mixtos son significativamente peores que las predicciones basadas en modelos de regresión estándar con efectos fijos solamente.
Entonces, ¿cuál es el punto de los modelos mixtos con respecto a los problemas de predicción?
EDITAR. El problema es el siguiente: ajusté un modelo mixto (con efectos fijos y aleatorios) y un modelo lineal estándar solo con efectos fijos. Cuando realizo la validación cruzada obtengo una siguiente jerarquía de precisión predictiva: 1) modelos mixtos al predecir el uso de efectos fijos y aleatorios (pero esto funciona, por supuesto, solo para observaciones con niveles conocidos de variables de efectos aleatorios, por lo que este enfoque predictivo no parece ser adecuado para aplicaciones predictivas reales!); 2) modelo lineal estándar; 3) modelo mixto cuando se usan predicciones a nivel de población (por lo que se eliminan los efectos aleatorios). Por lo tanto, la única diferencia entre el modelo lineal estándar y el modelo mixto es un valor algo diferente de los coeficientes debido a los diferentes métodos de estimación (es decir, hay los mismos efectos / predictores en ambos modelos, pero tienen diferentes coeficientes asociados).
Entonces, mi confusión se reduce a una pregunta: ¿por qué usaría un modelo mixto como modelo predictivo, ya que usar un modelo mixto para generar predicciones a nivel de población parece ser una estrategia inferior en comparación con un modelo lineal estándar?