Tiene razón en que los mismos valores en T-SNE pueden distribuirse en diferentes puntos, la razón por la que esto sucede es clara si observa el algoritmo con el que se ejecuta T-SNE.
x1=[0,1]x2=[0,1]
import numpy as np
from sklearn.manifold import TSNE
m = TSNE(n_components=2, random_state=0)
m.fit_transform(np.array([[0,1],[0,1]]))
También observaría que cambiar el random_state
realmente modifica las coordenadas de salida del modelo. No existe ninguna correlación real entre las coordenadas reales y su salida. Dado que el primer paso de TSNE calcula la probabilidad condicional.
xixjpj|i=exp(−||xj−xi||22σ2)∑k≠iexp(−||xj−xi||22σ2)pij=pi|j+pj|i2Npijxixj
R2
Entonces, la verdad es que, en lugar de mirar los dos grupos, mire las distancias entre ellos, porque eso transmite más información que las coordenadas mismas.
Espero que esto haya respondido a tu pregunta :)