La media armónica es el equivalente de la media aritmética para recíprocos de cantidades que deben promediarse mediante la media aritmética. Más precisamente, con la media armónica, transforma todos sus números a la forma "promediable" (tomando el recíproco), toma su media aritmética y luego transforma el resultado de nuevo a la representación original (volviendo a tomar el recíproco).
La precisión y el recuerdo son recíprocos "naturalmente" porque su numerador es el mismo y sus denominadores son diferentes. Las fracciones son más sensibles a promediar por media aritmética cuando tienen el mismo denominador.
Para mayor intuición, suponga que mantenemos constante el número de elementos positivos verdaderos. Luego, al tomar la media armónica de la precisión y la recuperación, implícitamente se toma la media aritmética de los falsos positivos y los falsos negativos. Básicamente significa que los falsos positivos y los falsos negativos son igualmente importantes para usted cuando los verdaderos positivos siguen siendo los mismos. Si un algoritmo tiene N más elementos positivos falsos pero N menos negativos falsos (mientras que tiene los mismos positivos verdaderos), la medida F permanece igual.
En otras palabras, la medida F es adecuada cuando:
- Los errores son igualmente malos, ya sean falsos positivos o falsos negativos.
- el número de errores se mide en relación con el número de verdaderos positivos
- los verdaderos negativos no son interesantes
El punto 1 puede ser cierto o no, existen variantes ponderadas de la medida F que se pueden usar si esta suposición no es cierta. El punto 2 es bastante natural ya que podemos esperar que los resultados escalen si clasificamos más y más puntos. Los números relativos deben permanecer iguales.
El punto 3 es bastante interesante. En muchas aplicaciones, los negativos son el valor predeterminado natural e incluso puede ser difícil o arbitrario especificar lo que realmente cuenta como un verdadero negativo. Por ejemplo, una alarma de incendio tiene un evento negativo verdadero cada segundo, cada nanosegundo, cada vez que pasa un tiempo de Planck, etc. Incluso un trozo de roca tiene estos eventos de detección de incendios negativos verdaderos todo el tiempo.
O en un caso de detección de rostros, la mayoría de las veces " no devuelve correctamente " miles de millones de áreas posibles en la imagen, pero esto no es interesante. Los casos son interesantes cuando no regrese una detección propuesto o cuando debe devolverlo.
Por el contrario, la precisión de la clasificación se preocupa por igual por los verdaderos positivos y los verdaderos negativos y es más adecuada si el número total de muestras (eventos de clasificación) está bien definido y es bastante pequeño.