Respuestas:
Matemáticamente, b_acc es la media aritmética de recordar_P y recordar_N y f1 es la media armónica de recordar_P y precisión_P.
Tanto F1 como b_acc son métricas para la evaluación del clasificador, que (en cierta medida) manejan el desequilibrio de clase. Dependiendo de cuál de las dos clases (N o P) supera en número a la otra, cada métrica supera a la otra.
1) Si N >> P, f1 es mejor.
2) Si P >> N, b_acc es mejor.
Claramente, si puede cambiar de etiqueta, ambas métricas se pueden usar en cualquiera de los dos casos de desequilibrio anteriores. De lo contrario, dependiendo del desequilibrio en los datos de entrenamiento, puede seleccionar la métrica adecuada.