Mi empresa está buscando crear una visualización PivotViewer de las publicaciones de blog de Wordpress 2 de un cliente durante los últimos 11 años. Para hacerlo, sin embargo, necesitamos editar las etiquetas un tanto al azar, incompletas y generalmente pobres para usarlas como categorías ordenables. Estoy buscando una herramienta que analice sus entradas de blog y realice el recuento de palabras, para darnos una idea de lo que estamos tratando.
Idealmente, tendría todas estas características:
- Lista negra de palabras (ignorar)
- Palabra derivada
- Sinónimo personalizado de fusión
- Contando todos los usos
- Contando el número de publicaciones en las que aparece una palabra.
Pensé que este tipo de análisis textual sería extremadamente común, pero no he podido encontrar ningún software que haga este tipo de cosas en blogs enteros. ¿Hay software disponible para hacer esto?