Estoy trabajando en un proyecto de Machine Learning con datos que ya están (muy) sesgados por la selección de datos.
Supongamos que tiene un conjunto de reglas codificadas. ¿Cómo se construye un modelo de aprendizaje automático para reemplazarlo, cuando todos los datos que puede usar son datos que ya fueron filtrados por esas reglas?
Para aclarar las cosas, supongo que el mejor ejemplo sería la Evaluación del riesgo de crédito : la tarea es filtrar a todos los clientes que probablemente no paguen.
- Ahora, los únicos datos (etiquetados) que tiene son de clientes que han sido aceptados por el conjunto de reglas, porque solo después de aceptar verá si alguien paga o no (obviamente). No sabe qué tan bueno es el conjunto de reglas y cuánto afectarán la distribución pagada a no pagada. Además, tiene datos sin etiquetar de los clientes que han sido rechazados, nuevamente debido al conjunto de reglas. Por lo tanto, no sabe qué hubiera pasado con esos clientes si hubieran sido aceptados.
Por ejemplo, una de las reglas podría ser: "Si la edad del cliente <18 años, entonces no acepte"
El clasificador no tiene forma de aprender a manejar clientes que han sido filtrados por estas reglas. ¿Cómo se supone que el clasificador debe aprender el patrón aquí?
Ignorar este problema llevaría al modelo a estar expuesto a datos que nunca antes había encontrado. Básicamente, quiero estimar el valor de f (x) cuando x está fuera de [a, b] aquí.