Estoy ajustando una regresión logística paso a paso en un conjunto de datos en SPSS. En el procedimiento, estoy ajustando mi modelo a un subconjunto aleatorio que es de aprox. 60% de la muestra total, lo que equivale a unos 330 casos.
Lo que me parece interesante es que cada vez que vuelvo a muestrear mis datos, aparecen y aparecen diferentes variables en el modelo final. Algunos predictores siempre están presentes en el modelo final, pero otros aparecen y desaparecen según la muestra.
Mi pregunta es esta ¿Cuál es la mejor manera de manejar esto? Esperaba ver la convergencia de las variables predictoras, pero ese no es el caso. Algunos modelos tienen un sentido mucho más intuitivo desde una vista operativa (y serían más fáciles de explicar a los tomadores de decisiones), y otros se ajustan un poco mejor a los datos.
En resumen, dado que las variables se barajan, ¿cómo recomendaría abordar mi situación?
Muchas gracias de antemano.