Citaré las preguntas frecuentes del sitio web de t-SNE . Primero para la perplejidad:
¿Cómo debo configurar la perplejidad en t-SNE?
El rendimiento de t-SNE es bastante robusto en diferentes configuraciones de perplejidad. El valor más apropiado depende de la densidad de sus datos. Hablando en términos generales, se podría decir que un conjunto de datos más grande / más denso requiere una mayor perplejidad. Los valores típicos para el rango de perplejidad entre 5 y 50.
Para todos los demás parámetros, consideraría leer esto:
¿Cómo puedo evaluar la calidad de las visualizaciones que t-SNE construyó?
Preferiblemente, solo míralos! Observe que t-SNE no retiene distancias sino probabilidades, por lo que es inútil medir algún error entre las distancias euclidianas en alta D y baja D. Sin embargo, si usa los mismos datos y perplejidad, puede comparar las divergencias de Kullback-Leibler que informa t-SNE. Está perfectamente bien ejecutar t-SNE diez veces y seleccionar la solución con la menor divergencia de KL.
En otras palabras, significa: mira la trama, si la visualización es buena, no cambies los parámetros. También puede elegir la ejecución con la divergencia KL más baja para cada perplejidad fija.