Contexto:
De una pregunta sobre Mathematics Stack Exchange (¿Puedo construir un programa) , alguien tiene un conjunto de puntos y , y quiere ajustarle una curva, lineal, exponencial o logarítmica. El método habitual es comenzar eligiendo uno de estos (que especifica el modelo) y luego hacer los cálculos estadísticos.
Pero lo que realmente se quiere es encontrar la "mejor" curva de lineal, exponencial o logarítmica.
Ostensiblemente, uno podría probar los tres y elegir la curva mejor ajustada de los tres de acuerdo con el mejor coeficiente de correlación.
Pero de alguna manera siento que esto no es del todo kosher. El método generalmente aceptado es elegir primero su modelo, uno de esos tres (o alguna otra función de enlace), luego, a partir de los datos, calcule los coeficientes. Y después de elegir de facto, lo mejor de todo es la recolección de cerezas. Pero para mí, ya sea que esté determinando una función o coeficientes a partir de los datos, sigue siendo lo mismo, su procedimiento es descubrir lo mejor ... (digamos que qué función es -también- se descubrirá otro coeficiente).
Preguntas:
- ¿Es apropiado elegir el modelo que mejor se ajuste entre los modelos lineales, exponenciales y logarítmicos, en base a una comparación de estadísticas de ajuste?
- Si es así, ¿cuál es la forma más adecuada de hacer esto?
- Si la regresión ayuda a encontrar parámetros (coeficientes) en una función, ¿por qué no puede haber un parámetro discreto para elegir cuál de las tres familias de curvas sería la mejor?