He leído el artículo de Alexandru Niculescu-Mizil y Rich Caruana " Obtención de probabilidades calibradas del aumento " y la discusión en este hilo. Sin embargo, todavía tengo problemas para comprender e implementar la logística o el escalado de Platt para calibrar la salida de mi clasificador de refuerzo de varias clases (refuerzo suave con tocones de decisión).
Estoy algo familiarizado con los modelos lineales generalizados, y creo que entiendo cómo funcionan los métodos logísticos y de calibración de Platt en el caso binario, pero no estoy seguro de saber cómo extender el método descrito en el documento al caso de clases múltiples.
El clasificador que estoy usando muestra lo siguiente:
- = Número de votos que el clasificador emite para la clase j para la muestra i que se está clasificando
- = clase estimada
En este punto tengo las siguientes preguntas:
P1: ¿Necesito usar un logit multinomial para estimar probabilidades? ¿o aún puedo hacer esto con regresión logística (p. ej. en una forma de 1 contra todos )?
P2: ¿Cómo debo definir las variables objetivo intermedias (por ejemplo, como en la escala de Platt) para el caso de múltiples clases?
P3: Entiendo que esto podría ser mucho pedir, pero ¿alguien estaría dispuesto a esbozar el pseudocódigo para este problema? (en un nivel más práctico, estoy interesado en una solución en Matlab).