He construido algunas redes neuronales (MLP (completamente conectadas), Elman (recurrente)) para diferentes tareas, como jugar Pong, clasificar dígitos escritos a mano y otras cosas ...
Además, intenté construir algunas primeras redes neuronales convolucionales, por ejemplo, para clasificar notas manuscritas de varios dígitos, pero soy completamente nuevo para analizar y agrupar textos, por ejemplo, en tareas de reconocimiento / agrupación de imágenes, uno puede confiar en entradas estandarizadas, como imágenes de tamaño 25x25, RGB o escala de grises y así sucesivamente ... hay muchas características de pre-suposición.
Para la minería de texto, por ejemplo, artículos de noticias, tiene un tamaño de entrada siempre cambiante (palabras diferentes, oraciones diferentes, longitud de texto diferente, ...).
¿Cómo se puede implementar una herramienta moderna de minería de texto utilizando inteligencia artificial, preferiblemente redes neuronales / SOM?
Lamentablemente, no pude encontrar tutoriales simples para comenzar. Los artículos científicos complejos son difíciles de leer y no son la mejor opción para aprender un tema (en mi opinión). Ya leí algunos artículos sobre MLP, técnicas de abandono, redes neuronales convolucionales, etc., pero no pude encontrar uno básico sobre minería de texto: todo lo que encontré fue un nivel demasiado alto para mis habilidades de minería de texto muy limitadas.