Tengo un conjunto de datos que consta de 10 variables. Ejecuté mínimos cuadrados parciales (PLS) para predecir una variable de respuesta única por estas 10 variables, extraje 10 componentes PLS y luego calculé la varianza de cada componente. En los datos originales tomé la suma de las varianzas de todas las variables, que es 702.
Luego dividí la varianza de cada uno de los componentes de PLS por esta suma para obtener el porcentaje de la varianza explicada por el PLS, y sorprendentemente todos los componentes juntos solo explican el 44% de la varianza original.
¿Cuál es la explicación de eso? ¿No debería ser 100%?