Tengo una pregunta sobre la clasificación en general. Supongamos que f es un clasificador, que genera un conjunto de probabilidades dados algunos datos D. Normalmente, uno diría: bueno, si P (c | D)> 0.5, asignaremos una clase 1, de lo contrario 0 (deje que esto sea un binario clasificación).
Mi pregunta es, ¿qué pasa si me entero que si clasifico como 1 también las probabilidades, mayores que: es decir, 0.2, el clasificador funciona mejor. ¿Es legítimo usar este nuevo umbral al hacer la clasificación?
Interpretaría la necesidad de una clasificación inferior limitada en el contexto de los datos que emiten una señal más pequeña; Sin embargo, sigue siendo importante para el problema de clasificación.
Me doy cuenta de que esta es una forma de hacerlo, pero si esto no es un pensamiento correcto, ¿cuáles serían algunas transformaciones de datos, que enfatizan las características individuales de manera similar, de modo que el umbral pueda permanecer en 0.5?