La propiedad de sus dos conjuntos de datos es la de la separabilidad lineal , simplemente, que hay una línea que los separa. Se dedica mucho aprendizaje automático a encontrar clasificadores lineales , que son líneas que realizan la separación que le interesa.
Mientras habla de líneas, supondré que sus puntos se encuentran en el plano. Lo que se quiere hacer es encontrar los valores de , w 2 y W 3 , de tal manera que para todos los puntos ( un 1 , un 2 ) en el conjunto A , W 1 a 1 + w 2 a 2 ≥ w 3 y para todos los puntos ( b 1 , b 2 ) en B , w 1 b 1 +w1w2w3(a1,a2)Aw1a1+w2a2≥w3(b1,b2)B . Así, la desigualdad w 1 x + w 2 y ≥ w 3 puede ser visto como un clasificador para el grupo A .w1b1+w2b2<w3w1x+w2y≥w3A
Existen muchos algoritmos de aprendizaje automático para determinar una línea óptima (regresión lineal, regresión logística, etc.). Estos encontrarán valores para basados en alguna métrica de error. Luego puede probar si todos los puntos están clasificados correctamente. Es decir, si todos los valores en A satisfacer la ecuación de arriba y de manera similar para B .w1,w2,w3AB
w1,w2,w3
w1ai1+w2ai2≥w3i=1,..,|A|A={(a11,a12),…,(a|A|1,a|A|2)}
w1bj1+w2bj2<w3j=1,..,|B|B={(b11,b12),…,(b|B|1,b|B|2)}
Si estas restricciones son consistentes, entonces existe una línea.