Preguntas etiquetadas con high-dimensional

Pertenece a una gran cantidad de características o dimensiones (variables) para datos. (Para una gran cantidad de puntos de datos, use la etiqueta [datos grandes]; si el problema es un número mayor de variables que datos, use la etiqueta [subdeterminado]).

8
¿Por qué la distancia euclidiana no es una buena métrica en altas dimensiones?
Leí que "la distancia euclidiana no es una buena distancia en grandes dimensiones". Supongo que esta afirmación tiene algo que ver con la maldición de la dimensionalidad, pero ¿qué es exactamente? Además, ¿qué son las "altas dimensiones"? He estado aplicando agrupamiento jerárquico usando la distancia euclidiana con 100 características. ¿Hasta …


7
¿El mejor algoritmo de PCA para una gran cantidad de características (> 10K)?
Anteriormente pregunté esto en StackOverflow, pero parece que podría ser más apropiado aquí, dado que no obtuvo ninguna respuesta en SO. Es una especie de intersección entre estadísticas y programación. Necesito escribir un código para hacer PCA (Análisis de componentes principales). He examinado los algoritmos conocidos e implementado este , …


3
¿Debería la reducción de dimensionalidad para la visualización considerarse un problema "cerrado", resuelto por t-SNE?
He estado leyendo mucho sobre el algoritmo -snettt para la reducción de dimensionalidad. Estoy muy impresionado con el rendimiento en los conjuntos de datos "clásicos", como MNIST, donde logra una separación clara de los dígitos ( ver artículo original ): También lo he usado para visualizar las características aprendidas por …





1
¿La maldición de la dimensionalidad afecta a algunos modelos más que a otros?
Los lugares que he estado leyendo sobre la maldición de la dimensionalidad lo explican conjuntamente con kNN principalmente, y los modelos lineales en general. Regularmente veo a los mejores clasificados en Kaggle usando miles de características en el conjunto de datos que apenas tiene 100k puntos de datos. Utilizan principalmente …





1
Es el teorema del contraste relativo de Beyer et al. artículo: "¿Sobre el comportamiento sorprendente de las métricas de distancia en el espacio de alta dimensión" engañoso?
Esto se cita muy a menudo cuando se menciona la maldición de la dimensionalidad y va (fórmula de la derecha llamada contraste relativo) limre→ ∞var ( | | XreEl | El |kmi[ | El | XreEl | El |k]) =0,entonces: Dmaxkre- Dminkrereminkre→ 0limre→∞var(El |El |XreEl |El |kmi[El |El |XreEl |El …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.