La regresión logística es la regresión, ante todo. Se convierte en un clasificador al agregar una regla de decisión. Daré un ejemplo que va hacia atrás. Es decir, en lugar de tomar datos y ajustar un modelo, voy a comenzar con el modelo para mostrar cómo este es realmente un problema de regresión.
En la regresión logística, estamos modelando las probabilidades de registro, o logit, de que ocurra un evento, que es una cantidad continua. Si la probabilidad de que ocurra el evento es P ( A ) , las probabilidades son:UNPAGS( A )
PAGS( A )1 - P( A )
Las probabilidades de registro, entonces, son:
Iniciar sesión( P(A )1- P( A ))
Como en la regresión lineal, modelamos esto con una combinación lineal de coeficientes y predictores:
logit = b0 0+ b1X1+ b2X2+ ⋯
Imagine que se nos da un modelo de si una persona tiene canas. Nuestro modelo usa la edad como el único predictor. Aquí, nuestro evento A = una persona tiene canas:
probabilidades de registro de canas = -10 + 0.25 * edad
...¡Regresión! Aquí hay un código de Python y una trama:
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
x = np.linspace(0, 100, 100)
def log_odds(x):
return -10 + .25 * x
plt.plot(x, log_odds(x))
plt.xlabel("age")
plt.ylabel("log odds of gray hair")
PAGS( A )
PAGS( A ) = 11 + exp( - probabilidades de registro ) )
Aquí está el código:
plt.plot(x, 1 / (1 + np.exp(-log_odds(x))))
plt.xlabel("age")
plt.ylabel("probability of gray hair")
PAGS( A ) > 0.5
La regresión logística también funciona muy bien como clasificador en ejemplos más realistas, pero antes de que pueda ser un clasificador, ¡debe ser una técnica de regresión!