Hay un par de reglas de puntuación adecuadas y estrictamente adecuadas para los datos de recuento que puede usar. Las reglas de puntuación son penalizaciones introducidas con P como la distribución predictiva yy el valor observado. Tienen una serie de propiedades deseables, en primer lugar que un pronóstico más cercano a la probabilidad real siempre recibirá menos penalización y hay un mejor pronóstico (único) y es cuando la probabilidad pronosticada coincide con la probabilidad verdadera. Por lo tanto, minimizar la expectativa de s ( y , P ) significa informar las probabilidades verdaderas. Ver también Wikipedia .s ( y, P)PAGSys ( y, P)
A menudo uno toma un promedio de aquellos sobre todos los valores predichos como
S= 1norte∑nortei = 1s ( y( i ), P( i ))
La regla que debe tomar depende de su objetivo, pero daré una caracterización aproximada cuando cada una sea buena para usar.
F( y)F ( y ) ∑ k 0 , 1 , … , ∞ I μ σPr ( Y= y)F( y)∑k0 , 1 , ... , ∞yoμσ
Reglas de puntuación estrictamente adecuadas
- Puntuación Brier : (estable para el desequilibrio de tamaño en predictores categóricos)s ( y, P) = - 2 f( y) + ∑kF2( k )
- Puntuación de Dawid-Sebastiani : (bueno para la elección general del modelo predictivo; estable para el desequilibrio de tamaño en los predictores categóricos)s (y,P) = (y- μσ)2+ 2 logσ
- Puntaje de desviación : ( es un término de normalización que solo depende de , en los modelos de Poisson generalmente se toma como la desviación saturada; bueno para usar con estimaciones de un marco de ML)g y ys (y,P) = - 2 logF(y) + gysolyy
- Puntuación logarítmica : (muy fácil de calcular; estable para el desequilibrio de tamaño en predictores categóricos)s (y,P) = - logF(y)
- Puntuación de probabilidad clasificada : (bueno para contrastar diferentes predicciones de conteos muy altos; susceptible de desequilibrio de tamaño en predictores categóricos)s ( y, P) = ∑k{ F( k ) - yo( y≤ k ) }2
- Puntaje esférico : (estable para el desequilibrio de tamaño en predictores categóricos)s ( y, P) = f( y)∑kF2( k )√
Otras reglas de puntuación (no tan adecuadas pero de uso frecuente)
- Puntuación de error absoluta :(Inapropiado)s ( y, P) = | y- μ |
- Puntuación de error al cuadrado : (no estrictamente adecuado; susceptible de valores atípicos; susceptible de desequilibrio de tamaño en predictores categóricos)s ( y, P) = ( y- μ )2
- Puntuación de error al cuadrado normalizada de Pearson : (no estrictamente adecuado; susceptible de valores atípicos; puede usarse para verificar si el modelo verifica si la puntuación promedio es muy diferente de 1; estable para el desequilibrio de tamaño en predictores categóricos)s ( y, P) = ( y- μσ)2
Ejemplo de código R para las reglas estrictamente adecuadas:
library(vcdExtra)
m1 <- glm(Freq ~ mental, family=poisson, data=Mental)
# scores for the first observation
mu <- predict(m1, type="response")[1]
x <- Mental$Freq[1]
# logarithmic (equivalent to deviance score up to a constant)
-log(dpois(x, lambda=mu))
# quadratic (brier)
-2*dpois(x,lambda=mu) + sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) })
# spherical
- dpois(x,mu) / sqrt(sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) }))
# ranked probability score
sum(ppois((-1):(x-1), mu)^2) + sum((ppois(x:10000,mu)-1)^2)
# Dawid Sebastiani
(x-mu)^2/mu + log(mu)