El modelo subyacente de PLS es que un determinado matriz y vector están relacionadas por donde es un latente de la matriz, y son términos de ruido (suponiendo que están centrados).
PLS produce estimaciones de y un vector de 'atajo' de coeficientes de regresión, modo que . Me gustaría encontrar la distribución de bajo algunos supuestos simplificadores, que probablemente deberían incluir lo siguiente:
- El modelo es correcto, es decir , para desconocidos ;
- El número de factores latentes, , se conoce y se usa en el algoritmo PLS;
- Los términos de error reales son iid cero-media normal con variaciones conocidas;
Esta pregunta está algo poco definida porque hay decenas de variantes del algoritmo 'the' PLS, pero aceptaría resultados para cualquiera de ellas. También aceptaría orientación sobre cómo estimar la distribución de través de, por ejemplo, un bootstrap, pero tal vez esa sea una pregunta separada.