Bueno, si tiene una muestra de una distribución pareto con los parámetros y (donde es el parámetro de límite inferior y es el parámetro de forma), la probabilidad logarítmica de eso muestra es: m > 0 α > 0 m αX1,...,Xnm>0α>0mα
nlog(α)+nαlog(m)−(α+1)∑i=1nlog(Xi)
Este es un aumento monotónico en , por lo que el maximizador es el valor más grande que es consistente con los datos observados. Como el parámetro define el límite inferior del soporte para la distribución de Pareto, lo óptimo esmmm
m^=miniXi
que no depende de . Luego, usando trucos de cálculo ordinarios, el MLE para debe satisfacerαα
nα+nlog(m^)−∑i=1nlog(Xi)=0
un poco de álgebra simple nos dice que el MLE de esα
α^=n∑ni=1log(Xi/m^)
En muchos sentidos importantes (por ejemplo, eficiencia asintótica óptima en el sentido de que alcanza el límite inferior de Cramer-Rao), esta es la mejor manera de ajustar los datos a una distribución de Pareto. El código de R a continuación calcula el MLE para un conjunto de datos dado, X
.
pareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) )
}
# example.
library(VGAM)
set.seed(1)
z = rpareto(1000, 1, 5)
pareto.MLE(z)
[1] 1.000014 5.065213
Editar: según el comentario de @cardinal e I a continuación, también podemos observar que es el recíproco de la media muestral de los , que suceden a tener una distribución exponencial. Por lo tanto, si tenemos acceso a un software que puede ajustarse a una distribución exponencial (lo que es más probable, ya que parece surgir en muchos problemas estadísticos), entonces se puede ajustar una distribución de Pareto transformando el conjunto de datos de esta manera y ajustándolo a una distribución exponencial en la escala transformada. α^log(Xi/m^)