Esta será una respuesta no técnica.
Tiene razón: PCA es esencialmente una rotación de los ejes de coordenadas, elegidos de tal manera que cada eje exitoso capture la mayor variación posible.
En algunas disciplinas (como, por ejemplo, psicología), a las personas les gusta aplicar PCA para interpretar los ejes resultantes. Es decir, quieren poder decir que el eje principal n. ° 1 (que es una cierta combinación lineal de variables originales) tiene algún significado particular. Para adivinar este significado, mirarían los pesos en la combinación lineal. Sin embargo, estos pesos son a menudo desordenados y no se puede discernir un significado claro.
En estos casos, las personas a veces optan por jugar un poco con la solución PCA de vainilla. Toman cierto número de ejes principales (que se consideran "significativos" por algún criterio) y además los rotan, tratando de lograr alguna "estructura simple", es decir, combinaciones lineales que serían más fáciles de interpretar. Hay algoritmos específicos que buscan la estructura más simple posible; uno de ellos se llama varimax. Después de la rotación varimax, los componentes sucesivos ya no capturan tanta varianza como sea posible. Esta característica de PCA se rompe al hacer la rotación varimax adicional (o cualquier otra).
Entonces, antes de aplicar la rotación varimax, tiene componentes principales "no rotados". Y luego, obtienes componentes principales "rotados". En otras palabras, esta terminología se refiere al procesamiento posterior de los resultados de PCA y no a la rotación de PCA en sí.
Todo esto es algo complicado por el hecho de que lo que se rota son cargas y no ejes principales como tales. Sin embargo, para los detalles matemáticos, lo remito (y cualquier lector interesado) a mi larga respuesta aquí: ¿PCA seguido de una rotación (como varimax) sigue siendo PCA?