Estoy construyendo una regresión logística en R usando el método LASSO con las funciones cv.glmnet
para seleccionar lambda
y glmnet
para el modelo final.
Ya conozco todas las desventajas con respecto a la selección automática del modelo, pero necesito hacerlo de todos modos.
Mi problema es que necesito incluir variables factoriales (categóricas) en el modelo, ¿hay alguna forma de hacerlo sin crear muchas variables ficticias? Estas variables son casi todas las cadenas y no números.
2
Tengo curiosidad acerca de la mejor manera de hacerlo también.
—
theforestecologist