Por lo tanto, tenemos el potencial para una aplicación de aprendizaje automático que se adapte bastante bien al dominio del problema tradicional resuelto por los clasificadores, es decir, tenemos un conjunto de atributos que describen un elemento y un "cubo" en el que terminan. Sin embargo, en lugar de crear modelos de probabilidades como en Naive Bayes o clasificadores similares, queremos que nuestra salida sea un conjunto de reglas más o menos legibles para el ser humano que pueda ser revisado y modificado por un usuario final.
El aprendizaje de reglas de asociación se parece a la familia de algoritmos que resuelve este tipo de problema, pero estos algoritmos parecen centrarse en identificar combinaciones comunes de características y no incluyen el concepto de un depósito final al que esas características podrían apuntar. Por ejemplo, nuestro conjunto de datos se parece a esto:
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
Solo quiero las reglas que dicen "si es grande y es de 2 puertas, es un camión", no las reglas que dicen "si es de 4 puertas también es pequeño".
Una solución alternativa que se me ocurre es simplemente usar algoritmos de aprendizaje de reglas de asociación e ignorar las reglas que no involucran un segmento final, pero eso parece un poco extraño. ¿Me he perdido alguna familia de algoritmos? ¿O tal vez estoy abordando el problema incorrectamente para empezar?