Sé que el objetivo de PCA es reducir la dimensionalidad
Esto es a menudo lo que la gente supone, pero de hecho PCA es solo una representación de sus datos en una base ortogonal. Esta base todavía tiene la misma dimensionalidad que sus datos originales. Nada se pierde ... todavía. La parte de reducción de dimensionalidad es completamente suya. Lo que PCA asegura es que las dimensiones superiores de su nueva proyección son las mejores dimensiones en las que sus datos podrían representarse. ¿Qué significa mejor? Ahí es donde entra en juego la varianza explicada.k k
obviamente no en este caso
¡No estaría tan seguro de eso! Desde su segunda gráfica, visualmente parece que gran parte de la información de sus datos puede proyectarse en una línea horizontal. ¡Esa es 1 dimensión, en lugar de la trama original que estaba en 2 dimensiones! Obviamente pierde algo de información porque está eliminando el eje Y, pero es su decisión aceptar si esta pérdida de información es aceptable.
Hay un montón de preguntas relacionadas con qué PCA está en el sitio, así que le recomiendo que las consulte aquí , aquí , aquí o aquí . Si tiene otras preguntas después de eso, publíquelas y con gusto lo ayudaré.
Como tu pregunta real:
¿Cuál es la historia que puedes contar sobre la temperatura frente al helado en la trama de PCA?
Dado que los nuevos ejes de coordenadas son una combinación lineal de las coordenadas originales, entonces ... ¡básicamente nada! PCA le dará una respuesta como (números compuestos):
P C 1P C 2= 2.5 × helado - 3.6 × temperatura= - 1.5 × helado + 0.6 × temperatura
¿Eso es útil para ti? Tal vez. Pero supongo que no :)
Editado
Agregaré este recurso que creo que es útil porque los gráficos interactivos son geniales.
Editado de nuevo
Para aclarar qué significa mejor :k
PCA intenta encontrar las dimensiones que producen la mayor varianza cuando los datos se proyectan sobre ellas. Suponiendo que sus datos tienen dimensiones, las primeras PC explican más varianza en sus datos que cualquier otra dimensión. Eso es lo que quiero decir con mejor . Si eso es útil o no es otra cosa.n > kkk k