Actualmente estoy trabajando en un proyecto para hacer pronósticos de datos de series temporales (datos mensuales). Estoy usando R para hacer el pronóstico. Tengo 1 variable dependiente (y) y 3 variables independientes (x1, x2, x3). La variable y tiene 73 observaciones, al igual que las otras 3 variables (alos 73). De enero de 2009 a enero de 2015. He comprobado las correlaciones y el valor p, y es muy importante ponerlo en un modelo. Mi pregunta es: ¿cómo puedo hacer una buena predicción usando todas las variables independientes? No tengo valores futuros para estas variables. Digamos que me gustaría predecir cuál es mi variable y en más de 2 años (en 2017). ¿Cómo puedo hacer esto?
Intenté el siguiente código:
model = arima(y, order(0,2,0), xreg = externaldata)
¿Puedo hacer una predicción del valor y durante 2 años con este código?
También probé un código de regresión:
reg = lm(y ~ x1 + x2 + x3)
Pero, ¿cómo me tomo el tiempo en este código? ¿Cómo puedo pronosticar cuál será mi valor y por encima de digamos 2 años? Soy nuevo en estadísticas y pronósticos. He leído y levantado el valor de retraso, pero ¿cómo puedo usar un valor de retraso en el modelo para hacer pronósticos?
En realidad, mi pregunta general es ¿cómo puedo pronosticar datos de series de tiempo con variables externas sin valor futuro?