Esto es una especie de seguimiento de esta pregunta sobre las direcciones de investigación de NLG en el campo de la lingüística.
¿Cómo realizan las herramientas de asistente personal como Siri, Google Now o Cortana la Generación del lenguaje natural (NLG)? Específicamente, la parte de generación de texto de oración . No me interesa la parte de texto a voz, solo la parte de generación de texto.
No estoy buscando exactamente cómo lo hace cada uno, ya que esa información probablemente no esté disponible.
Me pregunto qué configuración se requiere para implementar la generación de oraciones de esa calidad.
- ¿Qué tipo de datos necesitaría en una base de datos (en un nivel alto)?
- ¿Requiere tener un diccionario de cada palabra posible y su significado, junto con muchos libros / corpus anotados y analizados estadísticamente?
- ¿Requiere realmente grabar a las personas que hablan de una manera natural (como en programas de televisión o podcasts), transcribirlas en texto y luego agregarlas de alguna manera a su "sistema"? (para obtener frases realmente "humanas")
- ¿O simplemente están utilizando patrones de oraciones basados en sintaxis simples, sin una gigantesca base de datos semántica de "significado"? Donde alguien acaba de escribir un montón de expresiones regulares tipo cosa ...
- ¿Cuáles son los algoritmos que se usan para oraciones tan humanas escritas naturalmente?
Una razón para preguntar es que parece que el campo NLG está muy lejos de poder hacer lo que Siri y Google Now y otros están logrando. Entonces, ¿qué tipo de cosas están haciendo? (Solo para la parte de generación de texto de la oración).