Aprendí sobre PCA hace unas conferencias en clase y al investigar más sobre este concepto fascinante, aprendí sobre PCA escasa.
Quería preguntar, si no me equivoco, esto es lo que es PCA escaso: en PCA, si tiene puntos de datos con variables, puede representar cada punto de datos en espacio dimensional antes de aplicar PCA. Después de aplicar PCA, puede volver a representarlo en el mismo espacio dimensional, pero, esta vez, el primer componente principal contendrá la mayor varianza, el segundo contendrá la segunda dirección más varianza y así sucesivamente. Por lo tanto, puede eliminar los últimos componentes principales, ya que no causarán una gran pérdida de datos, y puede comprimir los datos. ¿Correcto?
La PCA dispersa está seleccionando componentes principales de modo que estos componentes contengan menos valores distintos de cero en sus coeficientes vectoriales.
¿Cómo se supone que esto te ayudará a interpretar mejor los datos? ¿Alguien puede dar un ejemplo?