Tengo que hacer una regresión logística binaria con muchas variables independientes. La mayoría de ellos son binarios, pero algunas de las variables categóricas tienen más de dos niveles.
¿Cuál es la mejor manera de lidiar con tales variables?
Por ejemplo, para una variable con tres valores posibles, supongo que se deben crear dos variables ficticias. Entonces, en un procedimiento de regresión gradual, ¿ es mejor probar ambas variables ficticias al mismo tiempo, o probarlas por separado?
Usaré SPSS, pero no lo recuerdo muy bien, entonces: ¿cómo maneja SPSS esta situación?
Además, para una variable categórica ordinal, ¿es bueno usar variables ficticias que recrean la escala ordinal? (Por ejemplo, utilizando tres variables ficticias para una variable ordinal 4-estado, puesto 0-0-0
para el nivel , para el nivel 2 , para el nivel 3 y para el nivel 4 , en lugar de , , y para los 4 niveles.)1-0-0
1-1-0
1-1-1
0-0-0
1-0-0
0-1-0
0-0-1