Hice una pregunta similar sobre la distancia entre "documentos" (artículos de Wikipedia, noticias, etc.). Hice esta pregunta por separado porque las consultas de búsqueda son considerablemente más pequeñas que los documentos y son mucho más ruidosas. Por lo tanto, no sé (y dudo) si las mismas métricas de distancia se usarían aquí.
Se prefieren las métricas de distancia léxica de vainilla o las métricas de distancia semántica de última generación, con mayor preferencia por esta última.