Soy nuevo en la página y bastante nuevo en estadísticas y R. Estoy trabajando en un proyecto para la universidad con el objetivo de encontrar la correlación entre la lluvia y el nivel de flujo de agua en los ríos. Una vez que se prueba la correlación, quiero pronosticarla / predecirla.
Los datos que tengo un conjunto de datos de varios años (tomados cada 5 minutos) para un río en particular que contiene:
- Precipitaciones en milímetros
- Flujo del río en metros cúbicos por segundo.
Este río no tiene nieve, por lo que el modelo se basa solo en la lluvia y el tiempo. Ocasionalmente hay temperaturas de congelación, pero estoy pensando en eliminar esos períodos de los datos tan atípicos como esa situación está fuera del alcance de mi proyecto.
Ejemplos Aquí tiene un par de parcelas de datos de muestra de la lluvia y el aumento del agua unas horas más tarde.
La línea roja es el flujo del río. La naranja es la lluvia. Puedes ver que siempre llueve antes de que suba el agua en el río. Hay una lluvia que comienza nuevamente al final de la serie temporal, pero afectará el flujo del río más adelante.
La correlación está ahí. Esto es lo que he hecho en R para probar la correlación usando ccf en R:
- la correlación cruzada
- la variable principal
- el retraso
Esta es mi línea R utilizada para el segundo ejemplo (un período de lluvia):
ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")
Mi interpretación es:
- que la lluvia conduce (ocurre primero),
ccf
Estoy en lo cierto?
Sobre la serie de tiempo . Esta serie de tiempo no tiene periodicidad o estacionalidad. La lluvia puede llegar en cualquier momento y causar un efecto. Se reduce en verano, pero aún sucede, es un área con mucha lluvia durante todo el año.
Modelo y previsión.
No sé cómo crear un modelo para poder hacer un pronóstico que me diga cuánto aumentará el volumen de un río después de un período de lluvia. He estado probando algunos arima
, auto arima
pero no he tenido mucho éxito. ¿Debo usar Arima
, vars
u otro modelo multivariado diferente? Cualquier enlace a un ejemplo sería de gran ayuda.
Por favor, avíseme si conoce la mejor manera de crear esta predicción, qué modelo debo usar. Hay algunas otras cosas que estoy considerando hacer, pero las saqué de esta explicación por simplicidad. Puedo compartir algunos datos si es necesario.