R - Interpretación de la trama de redes neuronales

Sé que hay preguntas similares sobre las estadísticas. SE, pero no encontré una que cumpla con mi solicitud; por favor, antes de marcar la pregunta como un duplicado, hágame ping en el comentario.

Ejecuto una red neuronal basada en el neuralnetpronóstico de la serie temporal del índice SP500 y quiero entender cómo puedo interpretar el diagrama publicado a continuación:

ingrese la descripción de la imagen aquí

Particularmente, me interesa entender cuál es la interpretación del peso de la capa oculta y el peso de entrada; ¿Podría alguien explicarme cómo interpretar ese número, por favor?

Cualquier sugerencia será apreciada.

— Quantopik
fuente

Aquí hay un artículo interesante que se relaciona con su pregunta. labs.eeb.utoronto.ca/jackson/ecol.%20modelling%20ANN.pdf

— MrMeritology

Gracias por el comentario, @MrMeritology! ¡Eso me pareció realmente útil!

— Quantopik

Si bien estoy seguro de que podrá comprender esta red neuronal (bastante simple), si la interpretación es una preocupación relativamente grande, entonces probablemente no debería usar una red neuronal en primer lugar. ¿Hay alguna razón específica por la que seleccionó uno sobre otros algoritmos?

— David

¡Sí, David! Me gustaría aprender usando este tipo de modelo. Nunca los usé en mi trabajo y lo estoy estudiando solo por diversión. ¿Tienes alguna idea sobre la interpretación de la trama?

— Quantopik

Necesito ayuda para interpretar un análisis ANN ¿Alguien que pueda ayudar?

— brillante kalu

Como dice David en los comentarios, si desea interpretar un modelo, es probable que desee explorar algo además de las redes neuronales. Dicho esto, desea comprender intuitivamente la trama de la red, es mejor pensar en ella con respecto a las imágenes (algo en lo que las redes neuronales son muy buenas).

Los nodos más a la izquierda (es decir, nodos de entrada) son sus variables de datos sin procesar.
Las flechas en negro (y los números asociados) son los pesos en los que puede pensar cuánto contribuye esa variable al siguiente nodo. Las líneas azules son los pesos sesgados. Puede encontrar el propósito de estos pesos en la excelente respuesta aquí .
Los nodos intermedios (es decir, cualquier cosa entre los nodos de entrada y salida) son sus nodos ocultos. Aquí es donde ayuda la analogía de la imagen. Cada uno de estos nodos constituye un componente que la red está aprendiendo a reconocer. Por ejemplo una nariz, boca u ojo. Esto no se determina fácilmente y es mucho más abstracto cuando se trata de datos que no son de imagen.
El nodo del extremo derecho (nodo (s) de salida) es la salida final de su red neuronal.

Tenga en cuenta que todo esto está omitiendo la función de activación que también se aplicaría en cada capa de la red.

— cdeterman
fuente

Gran respuesta @cdeterman! Muchas cosas parecen estar más claras ahora. Lo último ... según usted, ¿cómo puedo hacer una prueba inversa de la capacidad del modelo para pronosticar la salida basándose en el valor de entrada? Déjame explicarte mejor; en el caso de que use un modelo logístico simple, puedo usar el vector y las variables independientes para calcular un pronóstico de la variable dependiente. En el modelo de red neuronal, ¿cómo puedo hacer esto?

β

$\beta$

— Quantopik

@Quantopic Creo que te refieres a la computefunción en el neuralnetpaquete. La fuente no es terriblemente compleja si desea hacerlo a mano. Básicamente, está aplicando los pesos y la función de activación en cada capa al resultado final.

— cdeterman