Tengo un conjunto de datos con tres variables, donde todas las variables son cuantitativas. Vamos a llamarlo , y . Estoy ajustando un modelo de regresión en una perspectiva bayesiana a través de MCMC conx 1 x 2rjags
Hice un análisis exploratorio y el diagrama de dispersión de sugiere que se debe usar un término cuadrático. Luego instalé dos modelos
(1)
(2)
En el modelo 1, el tamaño del efecto de cada parámetro no es pequeño y el intervalo creíble del 95% no contiene el valor .
En el modelo 2, el tamaño del efecto de los parámetros y es pequeño y cada uno de los intervalos creíbles para todos los parámetros contiene .β 4 0
¿El hecho de que un intervalo creíble contenga es suficiente para decir que el parámetro no es significativo?
Luego ajusté el siguiente modelo
(3)
El tamaño del efecto de cada parámetro no es pequeño, pero con la excepción de todos los intervalos creíbles contienen .
¿Cuál es la forma correcta de hacer una selección de variables en las estadísticas bayesianas?
EDITAR: ¿ Puedo usar Lasso en cualquier modelo de regresión, como el modelo Beta? Estoy usando un modelo con dispersión variable donde donde es un vector. ¿Debo usar Laplace antes en también?δ
EDIT2: instalé dos modelos, uno con gaussiana para , y otro con Laplace (doble exponencial).δ j
Las estimaciones para el modelo gaussiano son
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
Los estimativos para el modelo de lazo son
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
Las estimaciones para y redujeron mucho en el modelo Lasso, ¿significa que debería eliminar estas variables del modelo?
EDITAR3: El modelo con doble exponencial anterior (Lasso) me da valores de desviación, BIC y DIC más grandes que el modelo con anteriores gaussianos e incluso obtengo valores más pequeños después de eliminar el coeficiente de dispersión en el modelo gaussiano.