La regresión y el aprendizaje automático se utilizan en las ciencias naturales para probar hipótesis, estimar parámetros y hacer predicciones ajustando modelos a los datos. Sin embargo, cuando tengo un modelo a priori , no quiero hacer ningún ajuste, por ejemplo, un modelo de un sistema físico determinista calculado a partir de los primeros principios. Simplemente quiero saber qué tan bien coincide mi modelo con los datos y luego entender qué partes del modelo contribuyen significativamente a la coincidencia. ¿Podría alguien señalarme una forma estadísticamente rigurosa de hacer esto?
En términos más específicos, supongamos que tengo un sistema físico para el cual una variable dependiente ( varía de 1 a , el tamaño de la muestra) en condiciones variables descritas por tres variables independientes , , y . Aunque el sistema real que generó los datos es complicado, hice algunas suposiciones simplificadoras para derivar un modelo teórico para el sistema, de modo que
,
donde es una función no lineal (y no linealizable) de las variables independientes y es la diferencia entre los valores medidos y predichos por el modelo. está completamente preespecificado; no se realiza ningún ajuste y no se estiman parámetros. Mi primer objetivo es determinar si es un modelo razonable para el proceso que produjo los valores medidos .
También desarrollé modelos simplificados y , que están anidados en (si eso importa en este caso). Mi segundo objetivo es determinar si coincide con los datos significativamente mejor que o , lo que sugiere que las características que diferencian modelo a partir de modelos y juegan un papel importante en el proceso que genera .
Ideas hasta ahora
Quizás si hubiera alguna forma de determinar la cantidad de parámetros o la cantidad de grados de libertad para mi modelo matemático, sería posible utilizar procedimientos existentes como una prueba de razón de probabilidad o una comparación AIC. Sin embargo, dada la forma no lineal de y la ausencia de parámetros obvios, no estoy seguro de si es razonable asignar parámetros o asumir lo que constituye un grado de libertad.
He leído que las medidas de bondad de ajuste, como el coeficiente de determinación ( ), se pueden usar para comparar el rendimiento del modelo. Sin embargo, no me queda claro cuál podría ser el umbral para una diferencia significativa entre los valores de . Además, debido a que no ajusto el modelo a los datos, la media de los residuos no es cero y puede ser diferente para cada modelo. Por lo tanto, un modelo de coincidencia adecuada que tiende a subestimar los datos podría arrojar un valor de tan pobre como un modelo imparcial pero poco adaptado a los datos.
También he leído un poco sobre las pruebas de bondad de ajuste (por ejemplo, Anderson-Darling), pero como las estadísticas no son mi campo, no estoy seguro de qué tan bien se adapta este tipo de prueba a mi propósito. Cualquier orientación sería apreciada.
f
está completamente especificada previamente. Es como un cuadro negro que produce la respuesta y
de las variables de entrada, y quiero saber qué tan bien lo está haciendo en comparación con los cuadros negros de la competencia. Una situación análoga podría estar tratando de evaluar la coincidencia entre la salida de una simulación numérica y las mediciones realizadas en el sistema físico real.
f()
que deba determinarse a partir de un ajuste a los datos, o la función estáf()
completamente especificada previamente?