Traté de detectar valores atípicos en el consumo de gas energético de algunos edificios holandeses, construyendo un modelo de red neuronal. Tengo muy malos resultados, pero no puedo encontrar la razón.
No soy un experto, así que me gustaría preguntarle qué puedo mejorar y qué estoy haciendo mal. Esta es la descripción completa: https://github.com/denadai2/Gas-consumption-outliers .
La red neuronal es una red FeedFoward con propagación hacia atrás. Como se describe aquí , dividí el conjunto de datos en un conjunto de datos "pequeño" de 41'000 filas, 9 características e intenté agregar más características.
Entrené las redes, pero los resultados tienen 14.14 RMSE, por lo que no puede predecir tan bien el consumo de gas, consecutivamente no puedo ejecutar un buen mecanismo de detección de valores atípicos. Veo que en algunos documentos que incluso si predicen el consumo diario o por hora en la energía eléctrica, tienen errores como MSE = 0.01.
¿Qué puedo mejorar? ¿Qué estoy haciendo mal? ¿Puedes echar un vistazo a mi descripción?