¿Por qué la medida F se usa generalmente para tareas de clasificación (supervisadas), mientras que la medida G (o índice de Fowlkes-Mallows) se usa generalmente para tareas de agrupación (sin supervisión)?
La medida F es la media armónica de la precisión y el recuerdo .
La medida G (o índice de Fowlkes-Mallows) es la media geométrica de la precisión y el recuerdo .
A continuación se muestra una trama de los diferentes medios.
F1 (armónico)
Geométrico
Aritmética
La razón por la que pregunto es que necesito decidir qué promedio usar en una tarea NLG, donde medí BLEU y ROUGE (donde BLEU es equivalente a precisión y ROUGE para recordar). ¿Cómo debo calcular la media de estos puntajes?