Tengo la salida de precisión del clasificador en porcentaje y el número de muestras de entrada. ¿Hay alguna prueba que pueda decir cuán estadísticamente significativo es el resultado basado en esta información?
Gracias
Tengo la salida de precisión del clasificador en porcentaje y el número de muestras de entrada. ¿Hay alguna prueba que pueda decir cuán estadísticamente significativo es el resultado basado en esta información?
Gracias
Respuestas:
Desea definir la distribución de la precisión de solo adivinar. Quizás esto es como donde binomial ( , ) para algunos conocidos (digamos 50%).
Luego calcule la posibilidad de observar los resultados que obtuvo, si este modelo nulo fuera cierto. En R, puede usarlo binom.test
o calcularlo directamente con pbinom
.
Por lo general, querrá comparar la precisión no con "adivinar" sino con algún método alternativo, en cuyo caso podría usar la prueba de McNemar ; en R, mcnemar.test
.
No veo dónde las pruebas contra la aleatoriedad completa son tan útiles. Un clasificador que solo puede vencer conjeturas aleatorias puras no es muy útil. Un problema mayor es su uso de proporción clasificada correctamente como su puntaje de precisión. Esta es una regla discontinua de puntaje impropia que se puede manipular fácilmente porque es arbitraria e insensible. Una (de muchas) formas de ver sus deficiencias es calcular la proporción clasificada correctamente si tiene un modelo con solo una intercepción. Será alto si los resultados no son cercanos a 0.5 en prevalencia.
Una vez que elija una regla más adecuada, sería valioso calcular un intervalo de confianza para el índice. La significación estadística es de poco valor.
Seguro que puedes computar un intervalo de confianza . Si es su precisión estimada en un conjunto de prueba de elementos, sostiene que
Creo que puede calcular cuánto difiere su rendimiento de uno aleatorio que calcula la ganancia . La precisión de un clasificador aleatorio es:
La ganancia es:
De hecho, creo que se puede esbozar una prueba estadística. El numerador podría verse como una variable aleatoria normal,, pero debe averiguar qué tipo de variable aleatoria el denominador podría ser.
Puede interesarle los siguientes documentos:
Creo que cubren lo que Dimitrios Athanasakis habla.
Implementé una opción de Yeh en la forma en que la entiendo:
Creo que una cosa que podrías probar sería una prueba de permutación. Simplemente ponga al azar permuta los pares de entrada-salida deseados que alimenta a su clasificador varias veces. Si no puede reproducir nada al mismo nivel en más de 100 permutaciones diferentes de lo que es significativo en el intervalo del 99%, etc. Este es básicamente el mismo proceso utilizado para obtener valores p (que corresponden a la probabilidad de obtener una correlación lineal de la misma magnitud después de permutar los datos al azar) y así sucesivamente.