Respuestas:
Muchos clasificadores pueden predecir puntajes continuos. A menudo, los puntajes continuos son resultados intermedios que solo se convierten en etiquetas de clase (generalmente por umbral) como el último paso de la clasificación. En otros casos, por ejemplo, se pueden calcular las probabilidades posteriores para la pertenencia a la clase (por ejemplo, análisis discriminante, regresión logística). Puede calcular el MSE utilizando estos puntajes continuos en lugar de las etiquetas de clase. La ventaja de esto es que evita la pérdida de información debido a la dicotomización.
Cuando el puntaje continuo es una probabilidad, la métrica MSE se llama puntaje de Brier.
Sin embargo, también hay problemas de clasificación que son más bien problemas de regresión disfrazados. En mi campo, eso podría, por ejemplo, clasificar casos según si la concentración de alguna sustancia excede o no un límite legal (que es un problema binario / discriminatorio de dos clases). Aquí, MSE es una opción natural debido a la naturaleza de regresión subyacente de la tarea.
En este artículo lo explicamos como parte de un marco más general:
C. Beleites, R. Salzer y V. Sergo:
Validación de modelos de clasificación blanda utilizando membresías de clase parcial: un concepto extendido de sensibilidad y Co. aplicado a la clasificación de los tejidos de astrocitoma
Chemom Intell. Laboratorio. Syst., 122 (2013), 12-22.
Cómo calcularlo: si trabaja en R, una implementación está en el paquete "softclassval", http: /softclassval.r-forge.r-project.org.
No entiendo cómo ... la clasificación exitosa es una variable binaria (correcta o no), por lo que es difícil ver qué cuadrarías.
En general, las clasificaciones se miden en indicadores como el porcentaje correcto, cuando una clasificación que se ha estimado a partir de un conjunto de entrenamiento, se aplica a un conjunto de pruebas que se dejó de lado anteriormente.
El error cuadrático medio ciertamente puede calcularse (y se calcula) para pronósticos o valores pronosticados de variables continuas, pero creo que no para clasificaciones.
Técnicamente puede, pero la función MSE no es convexa para la clasificación binaria. Por lo tanto, si un modelo de clasificación binaria se entrena con la función Costo MSE, no se garantiza que minimice la función Costo . Además, el uso de MSE como función de costo supone la distribución gaussiana, que no es el caso de la clasificación binaria.