Me gustaría saber si ustedes tienen algunos buenos tutoriales (rápidos y directos) sobre modelos de temas y LDA, enseñando intuitivamente cómo establecer algunos parámetros, qué significan y, si es posible, con algunos ejemplos reales.
Me gustaría saber si ustedes tienen algunos buenos tutoriales (rápidos y directos) sobre modelos de temas y LDA, enseñando intuitivamente cómo establecer algunos parámetros, qué significan y, si es posible, con algunos ejemplos reales.
Respuestas:
Si está trabajando en R, el tutorial de Carson Sievert sobre el uso de LDA para modelar temas en reseñas de películas es un excelente punto de partida:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
Este tutorial hace uso de LDAvis, una visualización interactiva de distribuciones de temas y palabras que realmente pueden ayudar a la intuición.
Además, aunque no es breve, las conferencias de David M. Blei sobre modelos de temas son un gran recurso para comprender el significado detrás de los parámetros: http://videolectures.net/mlss09uk_blei_tm/
Recomiendo este tutorial: Comenzando con el modelado de temas y MALLET
Aquí hay algunos enlaces adicionales para ayudarlo a comenzar ...
Buenos materiales introductorios (incluidos enlaces a trabajos de investigación): http://www.cs.princeton.edu/~blei/topicmodeling.html
Software:
Aún más aquí en el blog Biased Estimates: Lista de lectura de modelos de temas
Si está buscando algo simple para comenzar y fácil de implementar, se lo recomendaría.
El proyecto CLARIN-D ha reunido algunos buenos consejos para tutoriales para modelado de temas y LDA en el sitio de la Colección de Materiales de Enseñanza y Aprendizaje (TeLeMaCo) alojado por el centro CLARIN de la Universität des Saarlandes .
Sugiero probar el tutorial Gensim de Machine Learning Plu . Le proporcionará una visión global de NLP y LDA, que incluye: cómo preprocesar sus datos, realizar ingeniería de características y aplicar LDA.