Clases de distribuciones cerradas bajo máximo


11

Supongamos que es una clase de distribuciones de probabilidad en reales no negativos parametrizados por , de modo que Me pregunto qué clases conocidas de distribuciones están cerradas tomando el máximo y, es decir, si y son independientes, entonces .Qpp

Qp([0,))=1.
X1Qp1X2Qp2max(X1,X2)Qp3

2
¿Está buscando una caracterización matemática de tales clases o está preguntando cuál de las familias de distribuciones paramétricas generalmente conocidas puede tener esta propiedad?
whuber


@whuber Los tres tipos de valores extremos funcionan según el argumento que he dado a continuación. Sin embargo, no demuestro que sean los únicos.
Michael R. Chernick

El powerpoint de Stoev que cita Whuber muestra el resultado que he dado para estas distribuciones que describí y que se llaman maxi-estables, y el teorema citado en la presentación afirma además que son los únicos.
Michael R. Chernick

@ Michael ¿Notó la restricción a los valores no negativos en la pregunta? Eso descarta las distribuciones de valor extremo que tienen un soporte positivo en los reales negativos.
whuber

Respuestas:


12

Me parece que proponer distribuciones de valores extremos realmente responde una pregunta diferente. Demostraré que al abordar esta pregunta directamente y mostrarla conduce a distribuciones que no se encuentran entre los tipos de valores extremos.

Consideremos esto desde los primeros principios. Es inmediato, a partir de los axiomas de probabilidad y definición de CDF, que la distribución del máximo de dos variables aleatorias independientes con CDF y tiene para su CDF. Supongamos que existe una clase de distribuciones que está cerrada por pares de máximo; es decir,F1F2F1F2Ω={Fθ}

FθΩ, FϕΩ implies FθFϕΩ.

Es conveniente tomar logaritmos, extendiendo (como en los textos de análisis avanzados de Rudin) los números reales para incluir como el registro de . Los registros de CDF de variables aleatorias esencialmente compatibles con son (i) monóticamente no crecientes, (ii) igual a on , (iii) tienen límites correctos de , y ( iv) son cadlag. Desde este punto de vista, debe ser un subconjunto convexo de un cono dentro del espacio de funciones cadlag en . Para que se parametrice finitamente, ese cono debe generar un subespacio vectorial de dimensión finita. Eso todavía deja muchas posibilidades.0[0,)(,0)0ΩR

Algunas de estas posibilidades son bien conocidas. Considere, por ejemplo, el CDF de una variable uniforme en . Su CDF es igual a en , cuando y en . El cono que genera es el conjunto de CDF de la forma[0,1]0(,0]x0x11[1,)

Fθ(x)=exp(θlog(x))=xθ,0<x<1

parametrizado por . Claramente, el máximo de dos variables aleatorias independientes con distribuciones en esta familia tiene una distribución también en esta familia (sus parámetros simplemente se suman). Podemos, si lo deseamos, restringir a un subconjunto convexo de la forma y todavía tienen una familia máxima cerrada. Tenga en cuenta, por favor, que ningún miembro de esta familia es una distribución de valor extremo.θ>0{Fθ|θθ0}

Esta formulación incluye distribuciones discretas (que obviamente no se encuentran entre los tres tipos de distribuciones de valores extremos). Por ejemplo, considere las distribuciones soportadas en los números naturales para los cuales las probabilidades están dadas por0,1,2,,k,

Prθ(k)=θ1/(k+1)θ1/k

(tomando cuando ), parametrizado por . Por construcción, el CDF , de donde sigueθ1/k=0k=00<θ<1Fθ(k)=θ1/(k+1)

Fθ(k)Fϕ(k)=θ1/(k+1)ϕ1/(k+1)=(θϕ)1/(k+1),

y debido a que los supuestos implican , esto muestra que la familia está cerrada por pares máximos.0<θϕ<1

Espero que este análisis y estos dos ejemplos muestren que, contrariamente a una opinión expresada en un comentario, el enfoque de comenzar con un número finito de CDF bien elegidos y cerrarlos con respecto al máximo por pares (es decir, formando sus conos en un espacio vectorial relacionado apropiado) no solo es constructivo sino que produce clases de distribuciones interesantes y potencialmente útiles.


3
+1 para este análisis y para verificar la interpretación de las distribuciones de valores extremos.

1
@whuber: muchas gracias por la atención prestada a este problema, realmente no esperaba tantas buenas respuestas (y saludaré a todos los que respondieron). La construcción del cono (o semigrupo) que ha dado es realmente cierta: si es una familia de distribuciones, entonces su cierre (wrt ) tiene todos los elementos de la forma donde y . Desafortunadamente, me di cuenta de que también se necesita el cambio de cierre wrt (es decir, si entonces ). ¿Debo hacer una nueva pregunta para esto? Fθmax(Fθ1α1××Fθnαn)αi0nNF(x)ΩF(xa)Ω
Ilya

1
Eso es ciertamente una complicación, Ilya. Pero antes de cambiar cualquier cosa o publicar una nueva pregunta, ¡considere cómo conciliaría el requisito de cierre de turno con el requisito (aparentemente contradictorio) de que todas las variables tienen soporte no negativo! (Supongo que tendrá que restringir los posibles valores de .)a
whuber

No está relacionado con esta pregunta, pero busca ejemplos de familias estables bajo el producto.
Vincent Granville

1
@Vincent Para empezar, considere cualquier familia de variables aleatorias cerradas aditivamente y expongalas. Para una familia más rica, multiplique cualquiera de esas variables por una variable independiente de Rademacher (obteniendo variables soportadas en toda la línea real en lugar de solo los números positivos). U
whuber

10

Nota: Esta respuesta asume que las variables están distribuidas de manera idéntica , no solo distribuidas de acuerdo con la misma clase.

Esas serían las distribuciones de valor extremo . Hay tres de ellos, como se presentan generalmente, que corresponden a tres conjuntos de condiciones en la distribución subyacente para los cuales se encuentra la distribución limitante del máximo. Se cierran para encontrar el máximo, que es lo que quieres.

Copia más o menos de una versión anterior de Métodos de Análisis Estadístico para Datos de Confiabilidad y Vida (Mann, Schafer, Singpurwalla),

Tipo I: FX(n)(x)=exp{exp[xγα]}, <x<, α>0

Tipo II: FX(n)(x)=exp{(xγα)β}, xγ, α,β>0

Tipo III: FX(n)(x)=exp{[(xγα)β]}. xγ, α,β>0

Editar: ¡Lea los comentarios, que amplían esta respuesta para hacer una respuesta mucho mejor y más completa a esta pregunta!


3
+1 Pero los tipos I y III no se aplican a la pregunta.
whuber

Muy cierto (+1), estaba respondiendo una pregunta más general sin explicar la diferencia. Además, debería haber descrito la normalización que tiene que suceder para prevenir la degeneración, como lo hizo en su comentario a la respuesta de MC a continuación. ¡Enséñame a escribir estas respuestas cuando esté a punto de salir! (bueno, tal vez no ... :)
jbowman

1
@whuber Probablemente pregunte algo obvio, pero, ¿es cierto que si y son independientes, entonces ? X1Frechet(α1,β1)X2Frechet(α2,β2)max(X1,X2)Frechet(α3,β3)

2
Esa es una gran pregunta, @Procrastinator. No se me ocurrió ninguna razón por la cual tal resultado debería ser cierto, así que simulé 1,000,000 de valores iid de Frechet y 1,000,000 valores iid de Frechet y calculé sus máximos por pares. Los resultados no pueden ajustarse, ni siquiera aproximadamente, por ninguna distribución de Frechet . Necesita los tres parámetros (incluido el parámetro de ubicación) para cerrar esta familia bajo máximos. Luego, emulando un argumento (incompleto) en la respuesta de Michael Chernick, puede mostrar que debe desplazarse a escala de Frechet. (3,1)(10,1)(α,β)max(X1,X2)
whuber

Esta respuesta es incorrecta. El teorema del valor extremo se aplica cuando las distribuciones de las variables son idénticas , pero la pregunta dice que solo tienen que pertenecer a la misma clase (pueden tener parámetros diferentes).
user76284

0

Jbowman me ganó la respuesta. Una explicación de por qué funcionan es que el teorema de Gnedenko establece que si es una secuencia de variables aleatorias distribuidas idénticamente independientes bajo ciertas condiciones en la cola de la distribución converge a 1 de los tres tipos que jbowman enumeró en su respuesta. Ahora, dado que cualquier distribución de tipo I, tipo II o tipo III se puede expresar como el límite del máximo de una secuencia iid, entonces si es decir tipo I y es la distribución límite de como tiende al infinito y también es de tipo I y es el límite deX1,,XnnMn=max(X1,X2,,Xn)G1Mn=max(X1,X2,,Xn)nG2Nn=max(Y1,Y2,dotsc,Yn)luego decir y es la distribución del límite cuando tiende a infinito para entonces será de tipo I y sea la distribución para el máximo de una va con distribución y otro con distribución y por lo tanto, el tipo I está cerrado bajo maximización. El mismo argumento funciona para los tipos II y III.Vn=max(Mn,Nn)G3nVnG3G1G2


2
Para las distribuciones ilimitadas, el máximo no converge: diverge con . Al igual que con el CLT, se requiere una normalización adecuada. (Es por eso que es esencial incluir parámetros de ubicación y escala en estas familias). El artículo clásico de Gnedenko sobre el tema comienza (si no recuerdo mal) preguntando si se puede encontrar una serie de coeficientes afines modo que converge Después de establecer esto, obtiene las posibles formas de distribución limitante. nan,bnaMn+bn
whuber

En todos los casos debería haber dicho apropiadamente normalizado. Gracias. Incluso en el caso limitado, debe normalizarse para obtener el límite (creo que debería recordar esto, ¡mi disertación fue extrema! Pero hace 34 años)
Michael R. Chernick

3
Observe también que las distribuciones de valores extremos no responden exhaustivamente a la pregunta. (Esto no es una crítica, es solo una observación). Por ejemplo, restringiendo a los números naturales podemos definir que sea ​​la distribución uniforme en . Esta clase está cerrada por debajo del máximo ( ), pero ningún miembro es una distribución de valores extremos. pQp[p,p+1]max(Qp,Qr)Qmax(p,r)
Whuber

@whuber los tres tipos son casos ilimitados, pero el tipo III de cola corta incluye casos limitados como la distribución uniforme. Para U [0,1], P [Mn <= 1-x / n] converge a exp (-x) ya que P [Mn <= 1-x / n] = (1-x / n) ^ n.
Michael R. Chernick

3
Tus respuestas no parecen relevantes en el ejemplo que di, Michael. La distinción es que esta pregunta no es acerca de secuencias contables de variables iid o incluso secuencias contables de nada; solo pregunta sobre el cierre bajo pares de variables que generalmente tienen diferentes distribuciones. (Pero ahora veo que hay un defecto en mi ejemplo: el máximo cuando ya no es uniforme, por lo que tendría que agrandar la familia de manera apropiada para incluir máximos de muchos uniformes arbitrariamente.)p=r
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.