Entonces, estoy empezando a aprender cómo una red neuronal puede operar para reconocer patrones y categorizar entradas, y he visto cómo una red neuronal artificial puede analizar datos de imágenes y categorizar las imágenes ( demostración con convnetjs ), y la clave allí consiste en reducir la imagen y cada píxel estimula una neurona de entrada en la red.
Sin embargo, ¿estoy tratando de entender si esto se puede hacer con entradas de cadena? El caso de uso que tengo es un "motor de recomendaciones" para las películas que un usuario ha visto. Las películas tienen muchos datos de cadena (título, trama, etiquetas), y podría imaginarme "reducir el muestreo" del texto a unas pocas palabras clave que describan esa película, pero incluso si analizo las cinco palabras principales que describen esta película, yo ¿Crees que necesitaría neuronas de entrada para cada palabra en inglés para comparar un conjunto de películas? Podría limitar las neuronas de entrada solo a las palabras utilizadas en el set, pero ¿podría crecer / aprender agregando nuevas películas (el usuario ve una nueva película, con nuevas palabras)? ¿La mayoría de las bibliotecas que he visto no permiten agregar nuevas neuronas después de que el sistema ha sido entrenado?
¿Existe una forma estándar de asignar datos de cadena / palabra / carácter a entradas en una red neuronal? ¿O una red neuronal realmente no es la herramienta adecuada para el trabajo de analizar datos de cadena como este (qué es una mejor herramienta para la coincidencia de patrones en datos de cadena)?