¿Has oído hablar de la aproximación y proyección de colector uniforme (UMAP) ?
UMAP (Aproximación y proyección múltiple uniforme) es una nueva técnica de aprendizaje múltiple para la reducción de dimensiones no lineales. UMAP se construye a partir de un marco teórico basado en la geometría de Riemann y la topología algebraica. El resultado es un algoritmo práctico escalable que se aplica a datos del mundo real. El algoritmo UMAP es competitivo con t-SNE para la calidad de visualización, y posiblemente conserva más de la estructura global con un rendimiento superior en tiempo de ejecución. Además, UMAP como se describe no tiene restricciones computacionales en la dimensión de inclusión, por lo que es viable como una técnica de reducción de dimensión de propósito general para el aprendizaje automático.
Verifique su código y el documento original para obtener una lista de pros y contras, es muy fácil de usar.
Datos rápidos: UMAP puede manejar grandes conjuntos de datos y es más rápido que t-SNE y también admite la adaptación a datos de matriz dispersos, y al contrario de t-SNE, una técnica de reducción de dimensiones de propósito general, lo que significa que no solo se puede usar para visualización sino también para reducir el espacio de funciones para alimentar otros modelos de aprendizaje automático.
Ejemplos concretos: He comparado el método y lo he comparado con algunas otras técnicas de reducción de dimensionalidad en el cuaderno de referencia , si está interesado en echarle un vistazo rápido y comenzar rápidamente.