A menos que la solución de forma cerrada sea extremadamente costosa de calcular, generalmente es el camino a seguir cuando está disponible. Sin embargo,
Para la mayoría de los problemas de regresión no lineal no existe una solución de forma cerrada.
Incluso en la regresión lineal (uno de los pocos casos en los que hay disponible una solución de forma cerrada), puede ser poco práctico utilizar la fórmula. El siguiente ejemplo muestra una forma en que esto puede suceder.
Para la regresión lineal en un modelo de la forma , donde es una matriz con rango de columna completo, la solución de mínimos cuadrados,Xy=XβX
β^=argmin∥Xβ−y∥2
es dado por
β^=(XTX)−1XTy
Ahora, imagine que es una matriz muy grande pero dispersa. por ejemplo, puede tener 100,000 columnas y 1,000,000 de filas, pero solo 0.001% de las entradas en son distintas de cero. Existen estructuras de datos especializadas para almacenar solo las entradas distintas de cero de tales matrices dispersas. X XXXX
También imagine que tenemos mala suerte, y es una matriz bastante densa con un porcentaje mucho mayor de entradas distintas de cero. Almacenar una matriz densa de 100,000 por 100,000 elementos requeriría números de coma flotante (a 8 bytes por número, esto equivale a 80 gigabytes). Esto sería poco práctico para almacenar en cualquier cosa pero una supercomputadora Además, el inverso de esta matriz (o más comúnmente un factor Cholesky) también tenderá a tener entradas mayormente distintas de cero. X T X 1 × 10 10XTXXTX1×1010
Sin embargo, existen métodos iterativos para resolver el problema de mínimos cuadrados que no requieren más almacenamiento que , , y y nunca de manera explícita formar el producto de la matriz . y β X T XXyβ^XTX
En esta situación, usar un método iterativo es mucho más eficiente computacionalmente que usar la solución de forma cerrada para el problema de mínimos cuadrados.
Este ejemplo puede parecer absurdamente grande. Sin embargo, los grandes problemas de mínimos cuadrados dispersos de este tamaño se resuelven rutinariamente mediante métodos iterativos en computadoras de escritorio en la investigación de tomografía sísmica.