Sé que me falta algo en mi comprensión de la regresión logística, y realmente agradecería cualquier ayuda.
Hasta donde yo entiendo, la regresión logística supone que la probabilidad de un resultado '1' dadas las entradas, es una combinación lineal de las entradas, pasadas a través de una función de logística inversa. Esto se ejemplifica en el siguiente código R:
#create data:
x1 = rnorm(1000) # some continuous variables
x2 = rnorm(1000)
z = 1 + 2*x1 + 3*x2 # linear combination with a bias
pr = 1/(1+exp(-z)) # pass through an inv-logit function
y = pr > 0.5 # take as '1' if probability > 0.5
#now feed it to glm:
df = data.frame(y=y,x1=x1,x2=x2)
glm =glm( y~x1+x2,data=df,family="binomial")
y recibo el siguiente mensaje de error:
Mensajes de advertencia: 1: glm.fit: el algoritmo no convergió 2: glm.fit: las probabilidades ajustadas numéricamente 0 o 1 ocurrieron
He trabajado con R por algún tiempo; suficiente para saber que probablemente yo sea el culpable ... ¿qué está pasando aquí?