¿Alguien tiene experiencia con los enfoques para seleccionar el número de componentes principales dispersos para incluir en un modelo de regresión?
¿Alguien tiene experiencia con los enfoques para seleccionar el número de componentes principales dispersos para incluir en un modelo de regresión?
Respuestas:
Si bien no tengo información directa sobre su pregunta, me encontré con algunos documentos de investigación , que podrían ser de su interés. Eso es, por supuesto, si entiendo correctamente que está hablando de PCA escasa , regresión de componentes principales y temas relacionados. En ese caso, aquí están los documentos:
Los resultados de validación cruzada también se usaron para determinar el número óptimo de dimensiones para el espacio LSI. Muy pocas dimensiones no aprovecharon el poder predictivo de los datos; mientras que demasiadas dimensiones resultaron en un ajuste excesivo. La figura 4 muestra la distribución de errores promedio para modelos con diferentes números de dimensiones LSI. Los modelos con espacios LSI de cuatro dimensiones produjeron la menor cantidad promedio de errores y la menor cantidad mediana de errores, por lo que el modelo final se construyó utilizando un espacio LSI de cuatro dimensiones.
Puedo publicar una copia si no eres miembro de ieee.
Esto es de un artículo que escribí en pregrado. Tuve un problema en el que necesitaba decidir cuántas dimensiones (la indexación semántica latente es similar a la PCA) para usar en mi modelo de regresión logística. Lo que hice fue elegir una métrica (es decir, la tasa de error cuando se usa una probabilidad de marcado de .5) y examiné la distribución de esta tasa de error para diferentes modelos entrenados en diferentes números de dimensiones. Luego elegí el modelo con la tasa de error más baja. Podría usar otras métricas como área bajo la curva ROC.
También podría usar algo como la regresión paso a paso para elegir el número de dimensiones para usted. ¿Qué tipo de regresión estás realizando específicamente?
¿Qué quieres decir con escaso por cierto?