El significado intuitivo más cercano de la puntuación f1 se percibe como la media del recuerdo y la precisión. Vamos a aclararlo por ti:
En una tarea de clasificación, puede estar planeando construir un clasificador con alta precisión Y recuperación. Por ejemplo, un clasificador que dice si una persona es honesta o no.
Para mayor precisión, generalmente puede decir con precisión cuántas personas honestas hay en un grupo determinado. En este caso, cuando se preocupa por la alta precisión, asume que puede clasificar erróneamente a una persona mentirosa como honesta pero no con frecuencia. En otras palabras, aquí está tratando de identificar al mentiroso de honesto como un grupo completo.
Sin embargo, para recordar, usted estará realmente preocupado si cree que una persona mentirosa es honesta. Para usted, esta será una gran pérdida y un gran error y no querrá volver a hacerlo. Además, está bien si clasificó a alguien honesto como mentiroso, pero su modelo nunca (o sobre todo no debe) reclamar a una persona mentirosa como honesta. En otras palabras, aquí te estás enfocando en una clase específica y estás tratando de no cometer un error al respecto.
Ahora, tomemos el caso en el que desea que su modelo (1) identifique con precisión al honesto de un mentiroso (precisión) (2) identifique a cada persona de ambas clases (recuerdo). Lo que significa que seleccionará el modelo que funcionará bien en ambas métricas.
La decisión de selección de modelo intentará evaluar cada modelo en función de la media de las dos métricas. F-Score es el mejor que puede describir esto. Echemos un vistazo a la fórmula:
Recordar: p = tp / (tp + fp)
Recordar: r = tp / (tp + fn)
F-score: fscore = 2 / (1 / r + 1 / p)
Como puede ver, cuanto mayor sea el recuerdo Y la precisión, mayor será el puntaje F.