No entiendo por qué la reducción en la dimensión es importante. ¿Cuál es el beneficio de tomar algunos datos y reducir su dimensión?
No entiendo por qué la reducción en la dimensión es importante. ¿Cuál es el beneficio de tomar algunos datos y reducir su dimensión?
Respuestas:
La descomposición del valor singular (SVD) no es lo mismo que reducir la dimensionalidad de los datos. Es un método para descomponer una matriz en otras matrices que tiene muchas propiedades maravillosas a las que no entraré aquí. Para más información sobre SVD, vea la página de Wikipedia .
Reducir la dimensionalidad de sus datos a veces es muy útil. Puede ser que tenga muchas más variables que observaciones; Esto no es raro en el trabajo genómico. Puede ser que tengamos varias variables que están muy altamente correlacionadas, por ejemplo, cuando están fuertemente influenciadas por un pequeño número de factores subyacentes, y deseamos recuperar alguna aproximación a los factores subyacentes. Las técnicas de reducción de la dimensionalidad, como el análisis de componentes principales, el escalado multidimensional y el análisis de variantes canónicas, nos brindan información sobre las relaciones entre observaciones y / o variables que quizás no podamos obtener de otra manera.
Un ejemplo concreto: hace algunos años estaba analizando una encuesta de satisfacción de empleados que tenía más de 100 preguntas. Bueno, ningún gerente podrá ver más de 100 preguntas por valor de respuestas, incluso resumidas, y hacer más que adivinar lo que significa, porque quién puede decir cómo se relacionan las respuestas y qué las impulsa, realmente ? Realicé un análisis factorial sobre los datos, para el cual obtuve más de 10,000 observaciones, y obtuve cinco factores muy claros y fácilmente interpretables que podrían usarse para desarrollar puntajes específicos del gerente (uno para cada factor) que resumirían la totalidad de la encuesta de más de 100 preguntas. ¡Una solución mucho mejor que el volcado de hoja de cálculo de Excel que había sido el método anterior para informar resultados!
Con respecto a su segundo punto de la pregunta, los beneficios de la reducción de dimensionalidad para un conjunto de datos pueden ser:
Aparte de eso, más allá de PCA, SVD tiene muchas aplicaciones en procesamiento de señales, PNL y muchas más.
Echa un vistazo a esta respuesta mía. La descomposición de valores singulares es un componente clave del análisis de componentes principales , que es una técnica de análisis de datos muy útil y muy poderosa.
A menudo se usa en algoritmos de reconocimiento facial, y lo uso con frecuencia en mi trabajo diario como analista de fondos de cobertura.