Estoy construyendo una red neuronal para predecir el valor de una obra de arte con una amplia gama de entradas (tamaño, medio artístico, etc.) y me gustaría incluir también al autor como entrada (a menudo es una gran factor en el valor de una sola obra de arte).
Mi preocupación actual es que el nombre del autor no es una entrada numérica ideal para un NN (es decir, si solo codifico a cada autor con un valor entero creciente, indirectamente asignaré más valor a los autores más abajo en la lista -_-) . Mis pensamientos eran crear entradas separadas para todos los autores en mi conjunto de datos y luego usar una codificación activa para representar mejor la entrada al NN.
Sin embargo, este enfoque se encuentra con un problema cuando un autor que no está incluido en mis datos de entrenamiento se utiliza como entrada para el NN (es decir, un nuevo autor). Puedo evitar esto con un campo de entrada de "otro autor", pero me preocupa que esto no sea exacto, ya que no habría entrenado al NN para esta entrada (todas las obras de arte con una valoración tienen un autor).
No he pensado completamente en esto, pero pensé en entrenar 2 NN, uno para una valoración sin autor y otro para la valoración con un autor para asegurarme de que tengo suficientes datos de entrenamiento para que una "valoración sin autor" siga siendo razonablemente precisa.
Todavía estoy tratando de conceptualizar la mejor arquitectura NN antes de atascarme en la implementación, por lo que si alguien tiene alguna sugerencia / comentario, ¡estaría muy agradecido!
Gracias de antemano, Vince
PD: Estoy haciendo esto como una pequeña competencia con un amigo para probar un NN frente a las técnicas tradicionales de valoración comercial. Por favor, ayúdame a obtener una victoria en Informática sobre Ciencia actuarial.