Quiero comparar la precisión de dos clasificadores para la significación estadística. Ambos clasificadores se ejecutan en el mismo conjunto de datos. Esto me lleva a creer que debería estar usando una prueba t de una muestra de lo que he estado leyendo .
Por ejemplo:
Classifier 1: 51% accuracy
Classifier 2: 64% accuracy
Dataset size: 78,000
¿Es esta la prueba correcta para usar? Si es así, ¿cómo calculo si la diferencia de precisión entre el clasificador es significativa?
¿O debería estar usando otra prueba?