Tengo un conjunto de datos que contiene datos sobre temperatura, precipitación y rendimiento de soja para una granja durante 10 años (2005 - 2014). Me gustaría predecir los rendimientos para 2015 en función de estos datos.
Tenga en cuenta que el conjunto de datos tiene valores DIARIOS para temperatura y precipitación, pero solo 1 valor por año para el rendimiento, ya que la cosecha del cultivo ocurre al final de la temporada de cultivo.
Quiero construir una regresión o algún otro modelo basado en el aprendizaje automático para predecir los rendimientos de 2015, basado en una regresión / algún otro modelo derivado del estudio de la relación entre los rendimientos y la temperatura y la precipitación en años anteriores.
Estoy familiarizado con el aprendizaje automático usando scikit-learn. Sin embargo, no estoy seguro de cómo representar este problema. La parte difícil aquí es que la temperatura y la precipitación son diarias, pero el rendimiento es de solo 1 valor por año.
¿Cómo me acerco a esto?