La forma clásica del análisis de componentes principales (PCA) es hacerlo en una matriz de datos de entrada cuyas columnas tienen media cero (entonces PCA puede "maximizar la varianza"). Esto se puede lograr fácilmente centrando las columnas. Sin embargo, cuando la matriz de entrada es escasa, la matriz centrada ahora será más escasa y, si la matriz es muy grande, ya no quedará en la memoria. ¿Existe una solución algorítmica para el problema de almacenamiento?