Tengo un problema donde
Observo y, pero ni ni . Quiero estimar
Puedo estimar , usando algún tipo de modelo de regresión. Esto me da . Entonces podría estimar
Primer problema: un modelo de regresión para predecir podría llevar a ser negativo, lo que no tendría ningún sentido. No estoy seguro de cómo solucionar esto (no es el tipo de problema con el que he lidiado mucho), pero parece ser el tipo de cosas con las que los demás tratan habitualmente. ¿Algún tipo de GLM no gaussiano?
El principal problema es cómo explicar la incertidumbre en el modelo principal que proviene de la estimación de . He usado imputación múltiple antes para covariables faltantes. Pero este es un "parámetro latente" que falta. Alternativamente, son los datos de resultados, lo que parece correcto imputar . Sin embargo, a menudo escucho sobre EM usado para parámetros "latentes". No estoy seguro de por qué, ni sé si EM es mejor en estos contextos. MI es intuitivo tanto para comprender, implementar y comunicarse. EM es intuitivo de entender, pero parece más difícil de implementar (y no lo he hecho).
¿Es EM superior para el tipo de problema que tengo arriba? Si es así, ¿por qué? En segundo lugar, ¿cómo se implementa en R para un modelo lineal o para un modelo semiparamétrico (GAM)?