He realizado la clasificación usando múltiples clasificadores para datos etiquetados de 2 clases, y utilicé la validación cruzada 5 veces. Para cada pliegue calculé tp, tn, fp y fn. Luego calculé la precisión, precisión, recuperación y puntaje F para cada prueba. Mi pregunta es, cuando quiero promediar los resultados, tomé el promedio de precisiones, pero ¿puedo promediar la precisión, el recuerdo y el puntaje F también? ¿O esto sería matemáticamente incorrecto? PD Los conjuntos de datos utilizados en cada pliegue están bien equilibrados en términos del número de instancias por clase.
Gracias.