Necesito resolver un problema de regresión complicado sobre la unidad de disco. La pregunta original atrajo algunos comentarios interesantes, pero desafortunadamente no hubo respuestas. Mientras tanto, aprendí algo más sobre este problema, por lo que intentaré dividir el problema original en subproblemas y ver si tengo más suerte esta vez.
Tengo 40 sensores de temperatura regularmente espaciados en un anillo estrecho dentro del disco de la unidad:
Estos sensores adquieren temperatura a tiempo. Sin embargo, dado que la variación en el tiempo es mucho menor que la variación en el espacio, simplifiquemos el problema ignorando la variabilidad del tiempo y supongamos que cada sensor solo me da un promedio de tiempo. Esto significa que tengo 40 muestras (una para cada sensor) y no tengo muestras repetidas.
Me gustaría construir una superficie de regresión partir de los datos del sensor. La regresión tiene dos objetivos:
- Necesito estimar un perfil de temperatura radial media . Con la regresión lineal, ya calculo una superficie que es la superficie de temperatura media, por lo que solo necesito integrar mi superficie con respecto a , ¿verdad? Si uso polinomios para la regresión, este paso debería ser pan comido.
- Necesito estimar un perfil de temperatura radial , de modo que en cada posición radial, .
Dados estos dos objetivos, ¿qué técnica debo usar para la regresión en el disco de la unidad? Por supuesto, los procesos gaussianos se usan comúnmente para la regresión espacial. Sin embargo, la definición de un buen núcleo para el disco de la unidad no es trivial, por lo que me gustaría mantener las cosas simples y usar polinomios, a menos que sienta que es una estrategia perdedora. He leído sobre los polinomios de Zernike . Los polinomios de Zernike parecen ser apropiados para la regresión sobre la unidad de disco, ya que son periódicos en .
Una vez que se elige el modelo, necesito elegir un procedimiento de estimación. Dado que este es un problema de regresión espacial, los errores en diferentes ubicaciones deben estar correlacionados. Los mínimos cuadrados ordinarios suponen errores no correlacionados, por lo que supongo que los mínimos cuadrados generalizados serían más apropiados. GLS parece una técnica estadística relativamente común, dado que hay una gls
función en la distribución R estándar. Sin embargo, nunca he usado GLS, y tengo dudas. Por ejemplo, ¿cómo calculo la matriz de covarianza? Un ejemplo resuelto, incluso con unos pocos sensores, sería genial.
PD: Elegí usar polinomios Zernike y GLS porque me parece lo lógico hacer aquí. Sin embargo, no soy un experto, y si siente que voy en la dirección equivocada, siéntase libre de usar un enfoque completamente diferente.