Tengo curiosidad acerca de procedimientos repetibles que se pueden utilizar para descubrir la forma funcional de la función y = f(A, B, C) + error_term
donde mi única entrada es un conjunto de observaciones ( y
, A
, B
y C
). Tenga en cuenta que la forma funcional de f
es desconocida.
Considere el siguiente conjunto de datos:
AA BB CC DD EE FF == == == == == == 98 11 66 84 67 10500 71 44 48 12 47 7250 54 28 90 73 95 5463 34 95 15 45 75 2581 56 37 0 79 43 3221 68 79 1 65 9 4721 53 2 90 10 18 3095 38 75 41 97 40 4558 29 99 46 28 96 5336 22 63 27 43 4 2196 4 5 89 78 39 492 10 28 39 59 64 1178 11 59 56 25 5 3418 10 4 79 98 24 431 86 36 84 14 67 10526 80 46 29 96 7 7793 67 71 12 43 3 5411 14 63 2 9 52 368 99 62 56 81 26 13334 56 4 72 65 33 3495 51 40 62 11 52 5178 29 77 80 2 54 7001 42 32 4 17 72 1926 44 45 30 25 5 3360 6 3 65 16 87 288
En este ejemplo, suponga que lo sabemos FF = f(AA, BB, CC, DD, EE) + error term
, pero no estamos seguros de la forma funcional de f(...)
.
¿Qué procedimiento / qué métodos utilizarías para llegar a encontrar la forma funcional de f(...)
?
(Punto de bonificación: ¿Cuál es su mejor suposición sobre la definición de f
los datos anteriores? :-) Y sí, hay una respuesta "correcta" que arrojará un R^2
exceso de 0.99.)
R^2 >= 0.99
una, le gustaría encontrar la que tenga la mejor relación rendimiento / complejidad (y, por supuesto, fuera del ajuste de la muestra). Perdón por no escribir esa
FF
fue "rendimiento de combustión" yAA
fue la cantidad de combustible, yBB
fue la cantidad de oxígeno, buscaría un término de interacción deAA
yBB