Preguntas etiquetadas con pca

El análisis de componentes principales (PCA) es una técnica de reducción de dimensionalidad lineal. Reduce un conjunto de datos multivariado a un conjunto más pequeño de variables construidas, conservando tanta información (tanta varianza) como sea posible. Estas variables, llamadas componentes principales, son combinaciones lineales de las variables de entrada.





6
¿Se puede aplicar el análisis de componentes principales a conjuntos de datos que contienen una combinación de variables continuas y categóricas?
Tengo un conjunto de datos que tiene datos continuos y categóricos. Estoy analizando utilizando PCA y me pregunto si está bien incluir las variables categóricas como parte del análisis. Entiendo que PCA solo se puede aplicar a variables continuas. ¿Es eso correcto? Si no se puede utilizar para datos categóricos, …


1
¿Cómo revertir PCA y reconstruir variables originales de varios componentes principales?
El análisis de componentes principales (PCA) se puede utilizar para reducir la dimensionalidad. Después de realizar tal reducción de dimensionalidad, ¿cómo se puede reconstruir aproximadamente las variables / características originales a partir de un pequeño número de componentes principales? Alternativamente, ¿cómo se pueden eliminar o descartar varios componentes principales de …


4
PCA y proporción de varianza explicada
En general, ¿qué significa decir que la fracción de la varianza en un análisis como PCA se explica por el primer componente principal? ¿Alguien puede explicar esto intuitivamente pero también dar una definición matemática precisa de lo que significa "varianza explicada" en términos de análisis de componentes principales (PCA)?XXx Para …

3
Un ejemplo: regresión LASSO usando glmnet para el resultado binario
Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

6
¿Hay alguna buena razón para usar PCA en lugar de EFA? Además, ¿puede la PCA ser un sustituto del análisis factorial?
En algunas disciplinas, PCA (análisis de componentes principales) se usa sistemáticamente sin ninguna justificación, y PCA y EFA (análisis factorial exploratorio) se consideran sinónimos. Por lo tanto, recientemente utilicé PCA para analizar los resultados de un estudio de validación de escala (21 ítems en la escala Likert de 7 puntos, …


4
¿Cómo visualizar lo que hace el análisis de correlación canónica (en comparación con lo que hace el análisis de componentes principales)?
El análisis de correlación canónica (CCA) es una técnica relacionada con el análisis de componentes principales (PCA). Si bien es fácil enseñar PCA o regresión lineal utilizando un diagrama de dispersión (vea algunos miles de ejemplos en la búsqueda de imágenes de Google), no he visto un ejemplo bidimensional intuitivo …


5
Cargas vs autovectores en PCA: ¿cuándo usar uno u otro?
En el análisis de componentes principales (PCA), obtenemos vectores propios (vectores unitarios) y valores propios. Ahora, definamos las cargas comoCargas = Eigenvectores ⋅ Eigenvalores----------√.Cargas=Vectores propios⋅Valores propios.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. Sé que los vectores propios son solo direcciones y las cargas (como se definió anteriormente) también incluyen la variación a …
67 pca 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.