Statistics.com publicó un problema de la semana: la tasa de fraude de seguros residenciales es del 10% (una de cada diez reclamaciones es fraudulenta). Un consultor ha propuesto un sistema de aprendizaje automático para revisar las reclamaciones y clasificarlas como fraude o no fraude. El sistema es 90% efectivo para detectar reclamos fraudulentos, pero solo 80% efectivo para clasificar correctamente los reclamos que no son de fraude (erróneamente etiqueta a uno de cada cinco como "fraude"). Si el sistema clasifica un reclamo como fraudulento, ¿cuál es la probabilidad de que realmente sea fraudulento?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
Mi compañero y yo se nos ocurrió la misma respuesta de forma independiente y no coincide con la solución publicada.
Nuestra solución:
(.9 * .1) / ((. 9 * .1) + (. 2 * .9)) = 1/3
Su solución:
Este es un problema de probabilidad condicional. (También es un problema bayesiano, pero la aplicación de la fórmula en la regla de Bayes solo ayuda a ocultar lo que está sucediendo). Considere 100 afirmaciones. 10 serán fraudulentas, y el sistema etiquetará correctamente a 9 de ellas como "fraude". 90 reclamaciones estarán bien, pero el sistema clasificará incorrectamente 72 (80%) como "fraude". Por lo tanto, un total de 81 reclamaciones han sido etiquetadas como fraudulentas, pero solo 9 de ellas, el 11%, son realmente fraudulentas.
Quien tenia razon