Aquí hay un poco de contexto. Estoy interesado en determinar cómo dos variables ambientales (temperatura, niveles de nutrientes) impactan el valor medio de una variable de respuesta durante un período de 11 años. Dentro de cada año, hay datos de más de 100k ubicaciones.
El objetivo es determinar si, durante el período de 11 años, el valor medio de las variables de respuesta ha respondido a los cambios en las variables ambientales (por ejemplo, una temperatura más cálida + más nutrientes = una mayor respuesta).
Desafortunadamente, dado que la respuesta es el valor medio (sin mirar la media, solo la variación interanual regular amortiguará la señal), la regresión será de 11 puntos de datos (1 valor medio por año), con 2 variables explicativas. Para mí, incluso una regresión positiva lineal será difícil de considerar como significativa dado que el conjunto de datos es tan pequeño (ni siquiera cumple los 40 puntos / variables nominales a menos que la relación sea súper fuerte).
¿Tengo razón al hacer esta suposición? ¿Alguien puede ofrecer otros pensamientos / perspectivas que pueda estar perdiendo?
PD: Algunas advertencias: no hay forma de obtener más datos sin esperar años adicionales. Entonces, la información disponible es con lo que realmente tenemos que trabajar.