En general, el clasificador ingenuo de Bayes no es lineal, pero si los factores de probabilidad provienen de familias exponenciales , el clasificador ingenuo de Bayes corresponde a un clasificador lineal en un espacio de características particular. Aquí está cómo ver esto.p ( xyo∣ c )
Puedes escribir cualquier clasificador ingenuo de Bayes como *
p(c=1∣x)=σ(∑ilogp(xi∣c=1)p(xi∣c=0)+logp(c=1)p(c=0)),
donde es la función logística . Si es de una familia exponencial, podemos escribirlo comop ( x i ∣ c )σp(xi∣c)
p(xi∣c)=hi(xi)exp(u⊤icϕi(xi)−Ai(uic)),
y por lo tanto
p(c=1∣x)=σ(∑iw⊤iϕi(xi)+b),
dónde
wib=ui1−ui0,=logp(c=1)p(c=0)−∑i(Ai(ui1)−Ai(ui0)).
Tenga en cuenta que esto es similar a la regresión logística , un clasificador lineal, en el espacio de características definido por . Para más de dos clases, de forma análoga obtenemos regresión logística multinomial (o softmax) .ϕi
Si es gaussiano, entonces y deberíamos tener
ϕ i ( x i ) = ( x i , x 2 i ) w i 1p(xi∣c)ϕi(xi)=(xi,x2i)
wi1wi2bi=σ−21μ1−σ−20μ0,=2σ−20−2σ−21,=logσ0−logσ1,
suponiendo que .p(c=1)=p(c=0)=12
* Aquí es cómo derivar este resultado:
p(c=1∣x)=p(x∣c=1)p(c=1)p(x∣c=1)p(c=1)+p(x∣c=0)p(c=0)=11+p(x∣c=0)p(c=0)p(x∣c=1)p(c=1)=11+exp(−logp(x∣c=1)p(c=1)p(x∣c=0)p(c=0))=σ(∑ilogp(xi∣c=1)p(xi∣c=0)+logp(c=1)p(c=0))