Tengo un pequeño puñado de juegos de palabras competitivos en progreso, y aunque la preferencia es jugar (principalmente asincrónica) contra otros oponentes humanos, me gustaría ofrecer a los jugadores la opción de jugar contra una IA. Tengo mi diccionario y puedo darle fácilmente a la IA un conocimiento completo del diccionario mientras está jugando, pero mi preocupación es que tener a la IA jugando regularmente palabras con las que no están familiarizados será una experiencia frustrante para los jugadores: 'Habría ganado ese juego ¡Si solo hubiera usado palabras que sé! - incluso si el nivel de habilidad general de la IA se rechaza.
Prefiero crear una IA más débil a través de una combinación de parámetros de juego (no) sintonizados y un vocabulario más débil, pero no estoy seguro de cómo limitar ese vocabulario a palabras 'comunes'. He visto varias listas de frecuencia de palabras (por ejemplo, la lista de todas las palabras que aparecen en los libros del Proyecto Gutenberg, ordenadas por número de ocurrencias) pero todas tienen una serie de falsos negativos: palabras que todos saben que simplemente no t aparece con cualquier frecuencia real (por ejemplo, CHEETAH aparece con menos frecuencia en los textos de PG que VOCATIVE o SUTTEE). He intentado usar los resultados de búsqueda para obtener estimaciones de la popularidad de una palabra, pero también tienden a ser falsas estimaciones erróneas, y por supuesto que '
¿Alguien tiene sugerencias sobre otros buenos medios para determinar una frecuencia aproximada del uso de palabras, u otras formas de limitar la IA del juego de palabras que se sentirán naturales para los jugadores?