La principal diferencia entre interpolación y regresión es la definición del problema que resuelven.
Dados n puntos de datos, cuando interpola, busca una función que tenga una forma predefinida que tenga los valores en esos puntos exactamente como se especifica. Eso significa que los pares dados (xi,yi) buscan F de alguna forma predefinida que satisfaga F(xi)=yi . Creo que más comúnmente se elige F como polinomio, spline (polinomios de bajo grado en intervalos entre puntos dados).
Cuando hace una regresión, busca una función que minimice algunos costos, generalmente la suma de cuadrados de errores. No necesita que la función tenga los valores exactos en los puntos dados, solo desea una buena aproximación. En general, su función encontrada podría no satisfacer para cualquier punto de datos, pero la función de costo, es decir, será la más pequeña posible de todas las funciones de forma dada.FF(xi)=yi∑ni=1(F(xi)−yi)2
Un buen ejemplo de por qué es posible que solo desee aproximar en lugar de interpolar los precios en el mercado de valores. Puede tomar precios en algunas unidades de tiempo recientes e intentar interpolarlos para obtener una predicción del precio en la siguiente unidad de tiempo. Esta es una mala idea, porque no hay razón para pensar que las relaciones entre los precios puedan expresarse exactamente por un polinomio. Pero la regresión lineal podría ser útil, ya que los precios podrían tener cierta "pendiente" y una función lineal podría ser una buena aproximación, al menos localmente (pista: no es tan fácil, pero la regresión es definitivamente una mejor idea que la interpolación en este caso )k