Entonces, en el modelado de texto (sin supervisión), la asignación de Dirichlet latente (LDA) es una versión bayesiana del análisis semántico latente probabilístico (PLSA). Esencialmente, LDA = PLSA + Dirichlet antes de sus parámetros. Tengo entendido que LDA es ahora el algoritmo de referencia y se implementa en varios paquetes, mientras que PLSA ya no debería usarse.
Pero en la categorización de texto (supervisado), podríamos hacer exactamente lo mismo para el clasificador multinomial Naive Bayes y poner un Dirichlet antes que los parámetros. Pero no creo haber visto a nadie hacer eso, y la versión de "estimación puntual" de Naive Bayes multinomial parece ser la versión implementada en la mayoría de los paquetes. ¿Hay alguna razón para eso?