Hay varias alternativas a la regresión por pasos . Los más usados que he visto son:
- Opinión de expertos para decidir qué variables incluir en el modelo.
- Regresión de mínimos cuadrados parciales . Esencialmente obtienes variables latentes y haces una regresión con ellas. También puede hacer PCA usted mismo y luego usar las variables principales.
- Operador de selección y contracción menos absoluta (LASSO).
Tanto la Regresión PLS como LASSO se implementan en paquetes R como
PLS : http://cran.r-project.org/web/packages/pls/ y
LARS : http://cran.r-project.org/web/packages/lars/index.html
Si solo desea explorar la relación entre su variable dependiente y las variables independientes (por ejemplo, no necesita pruebas de significación estadística), también recomendaría métodos de aprendizaje automático como bosques aleatorios o árboles de clasificación / regresión . Los bosques aleatorios también pueden aproximar relaciones complejas no lineales entre sus variables dependientes e independientes, que podrían no haber sido reveladas por técnicas lineales (como la regresión lineal ).
Un buen punto de partida para Machine Learning podría ser la vista de tareas de Machine Learning en CRAN:
Vista de tareas de aprendizaje automático : http://cran.r-project.org/web/views/MachineLearning.html