Estoy haciendo una diagonalización de Lanczos de una gran matriz dispersa (~ 2 millones de elementos). Casi todos los pasos del algoritmo de Lanzcos se realizan en paralelo en la GPU, excepto la diagonalización de la matriz de Lanczos para verificar la convergencia. Para eso, he estado usando el algoritmo TQLI de Numerical Recipes. ¿Existen métodos para encontrar el sistema propio de una matriz tridiagonal que sean paralelos o fácilmente paralelizables? ¿Existe una versión paralela de TQLI?