Actualmente estoy ejecutando un modelo de regresión múltiple utilizando datos imputados y tengo algunas preguntas.
Antecedentes:
Uso de SPSS 18. Mis datos parecen ser MAR. La eliminación en lista de casos me deja con solo 92 casos, la imputación múltiple deja 153 casos para el análisis. Todos los supuestos cumplidos: un registro variable transformado. 9 IV's 5 - 5 categóricos, 3 escalas, 1 intervalo. Escala DV. Usando el método enter de regresión múltiple estándar.
- Mi DV es la diferencia de puntajes entre una medida de puntaje anterior y posterior, a estas dos variables les faltan varios casos: ¿debo imputar los valores faltantes para cada uno de ellos y luego calcular la diferencia entre ellos para calcular mi DV? (¿cómo hago para hacer esto?) o ¿puedo simplemente imputar datos para mi DV? ¿Cuál es el enfoque más apropiado?
- ¿Debo ejecutar imputaciones en datos transformados o datos no transformados sesgados?
- ¿Debo ingresar todas las variables en el proceso de imputación, incluso si no faltan datos, o debería simplemente imputar datos para las variables que faltan más del 10% de los casos?
He ejecutado la regresión en los casos eliminados en listas y mi IV representa muy poca variación en mi DV, luego he ejecutado la regresión en un archivo completo después de una imputación múltiple. Los resultados son muy similares, ya que mis 9 IV todavía predecir solo aproximadamente el 12% de la varianza en mi DV, sin embargo, ahora uno de mis IV's indica que está haciendo una contribución significativa (esta es una variable transformada logarítmica) ...
- ¿Debo informar los datos originales si hay poca diferencia entre mis conclusiones, es decir, mi IV pronostica mal el dv o informa los datos completos?
R^2
ocurra un nivel bajo ). Vea una buena discusión sobre los diseños previos a la publicación aquí . ¡Aunque eso todavía no responde totalmente a tu pregunta!