Desde un punto de vista práctico ...
LDA comienza con una entrada de bolsa de palabras que considera qué palabras coexisten en los documentos, pero no presta atención al contexto inmediato de las palabras. Esto significa que las palabras pueden aparecer en cualquier parte del documento y en cualquier orden, lo que elimina un cierto nivel de información. Por el contrario, word2vec tiene que ver con el contexto en el que se usa una palabra, aunque quizás no sea el orden exacto.
Los "temas" de LDA son una construcción matemática y no debes confundirlos con temas humanos reales. Puede terminar con temas que no tienen interpretación humana, son más como artefactos del proceso que temas reales, y puede terminar con temas en diferentes niveles de abstracción, incluidos temas que básicamente cubren el mismo tema humano. Es un poco como leer hojas de té.
He encontrado que LDA es útil para explorar datos, pero no tanto para proporcionar una solución, pero su kilometraje puede variar.
Word2vec no crea temas directamente en absoluto. Proyecta palabras en un espacio de alta dimensión basado en un uso similar, por lo que puede tener sus propias sorpresas en términos de palabras que usted considera distintas, o incluso opuestas, pueden estar cerca unas de otras en el espacio.
Puede usar cualquiera para determinar si las palabras son "similares". Con LDA: ¿las palabras tienen pesos similares en los mismos temas? Con word2vec: están cerca (en cierta medida) en el espacio de incrustación.
Puede usar cualquiera para determinar si los documentos son similares. Con LDA, buscaría una mezcla similar de temas, y con word2vec haría algo como sumar los vectores de las palabras del documento. ("Documento" podría ser una oración, párrafo, página o un documento completo). Doc2vec es una versión modificada de word2vec que permite la comparación directa de documentos.
Si bien LDA arroja algo de información contextual con su enfoque de bolsa de palabras, tiene temas (o "temas"), que word2vec no tiene. Por lo tanto, es sencillo usar doc2vec para decir: "Muéstrame documentos que sean similares a este", mientras que con LDA es sencillo decir: "Muéstrame documentos donde el tema A es prominente". (Nuevamente, sabiendo que el "tema A" surge de un proceso matemático en sus documentos y luego descubre a qué tema (s) humano corresponde principalmente).