¿Cuál es el punto de los modelos gráficos?

Pasé el día aprendiendo sobre el paquete bnlearn en R solo para descubrir que los modelos bayesianos no funcionan con gráficos no dirigidos. Estoy tratando de aprender sobre la red de campo aleatorio de Markov, y hasta ahora todo lo que he podido hacer es crear la estructura gráfica usando un LASSO gráfico.

En los gráficos dirigidos, parece haber dos etapas: "aprendizaje estructural" realizado por algún método, y luego "aprendizaje de parámetros" realizado por otro método. Mi sensación es que el aprendizaje de parámetros le informa sobre los pesos de borde entre cada variable (característica) incluida en su modelo. Mi pregunta es ... ¿y qué? ¿Qué haces con un gráfico con pesos de borde?

Si tengo un conjunto de datos que es observaciones por características, y los nodos de mi gráfico son las características de este conjunto de datos (extraído del LASSO gráfico que intenta emular el inverso de la matriz de covarianza), ¿qué puedo aprender de esto? ¿Puedo comparar cohortes de mis datos (separados por el valor de la clase objetivo) y asignar algún tipo de análisis de valor p con los nodos? Estoy confundido, creo, sobre el panorama general de los modelos gráficos.

— me estás bromeando
fuente

El valor y el poder de los modelos gráficos de las relaciones probabilísticas condicionales es que transmiten información sobre la estructura causal y la estructura inferencial del sistema. Por ejemplo, la lluvia o los rociadores pueden causar aceras mojadas, pero las aceras mojadas no pueden causar lluvia o rociadores de rociadores. Si su evidencia es "lluvia" y "no rociadores", puede inferir ciertas cosas. Si su evidencia es "acera mojada" puede inferir otras cosas. Lo que puede y no puede inferir está determinado por la estructura de la gráfica.

Su ejemplo de "un conjunto de datos que es observaciones por características" puede o no ser adecuado para un gráfico probabilístico. Creo que añadir ideas / métodos como "valores p" solo te confundirá. (Los valores P se aplican a las pruebas de hipótesis frecuentistas). Metafóricamente, estás combinando manzanas, naranjas y armadillos.

Le sugiero que vea las conferencias de Judea Pearl ( https://www.youtube.com/watch?v=zHjdd--W6o4 , https://www.youtube.com/watch?v=IiXvpPyhMw8 ) más lecciones de tutoría como estas : https://www.youtube.com/watch?v=YvdpnqMRmfk , https://www.youtube.com/watch?v=Xhdpk9HZQuo .

— MrMeritology
fuente

¡Ah bien! Así que vi ambos, y noté que todos los gráficos dirigidos contienen un nodo de resultados, y esto tiene sentido para mí (que hay una relación dirigida entre las características y el resultado, y entre las características que son combinaciones lineales de otras características, etc. ) Mi pregunta ahora es ... ¿cómo se incorporan los nodos de destino (resultado) en los modelos gráficos? El método de covarianza inversa para el aprendizaje estructural que usan los RF de Markov no incluye el nodo objetivo (clase de resultado), solo los vectores de características del conjunto de entrenamiento, etc.

— areyoujokingme

Por lo tanto, los RF de Markov están describiendo las relaciones entre las características, pero no la relación de las características con la variable de clase de predicción. Entonces, ¿qué puede realmente concluir además, quizás, qué características son más influyentes en relación con otras?

— areyoujokingme