Con la información dada por @Glen_b pude encontrar la respuesta. Usando las mismas anotaciones que la pregunta
P(Zk≤x)=∑j=0k+1(k+1j)(−1)j(1−jx)k+,
donde si y contrario. También doy la expectativa y la convergencia asintótica a la distribución de Gumbel ( NB : no Beta)a > 0 0a+=aa>00
E(Zk)=1k+1∑i=1k+11i∼log(k+1)k+1,P(Zk≤x)∼exp(−e−(k+1)x+log(k+1)).
El material de las pruebas se toma de varias publicaciones vinculadas en las referencias. Son algo largos, pero directos.
1. Prueba de la distribución exacta.
Deje ser variables aleatorias uniformes IID en el intervalo . Al ordenarlos, obtenemos las estadísticas de orden indicadas . Los uniformes se definen como , con y . Los espacios ordenados son las estadísticas ordenadas correspondientes . La variable de interés es .( 0 , 1 ) k ( U ( 1 ) , … , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) U ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 ) ≤(U1,…,Uk)(0,1)k( U( 1 ), ... , U( k ))Δyo= U( i )- U( i - 1 )U( 0 )= 0U( k + 1 )= 1 Δ ( k + 1 )Δ( 1 )≤ … ≤ Δ( k + 1 )Δ( k + 1 )
Para fijo , definimos la variable indicadora . Por simetría, el vector aleatorio es intercambiable, por lo que la distribución conjunta de un subconjunto de tamaño es la misma que la distribución conjunta de la primera . Al expandir el producto, obtenemos así1 i = 1 { Δ i > x } ( 1 1 , … , 1 k + 1 ) j jx ∈ ( 0 , 1 )1yo= 1{ Δyo> x }( 11, ... , 1k + 1)jj
PAGS( Δ( k + 1 )≤ x ) = E( ∏i = 1k + 1( 1 - 1yo) ) = 1 + ∑j = 1k + 1( k+1j) (-1)jmi( ∏i = 1j1yo) .
Ahora demostraremos que , que establecerá la distribución dada anteriormente. Probamos esto para , ya que el caso general se demuestra de manera similar. j = 2mi( ∏ji = 11yo) =(1-jx )k+j=2
E(∏i=121i)=P(Δ1>x∩Δ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).
Si , los puntos de interrupción están en el intervalo . Condicionalmente en este evento, los puntos de ruptura siguen siendo intercambiables, por lo que la probabilidad de que la distancia entre el segundo y el primer punto de ruptura sea mayor que es la misma que la probabilidad de que la distancia entre el primer punto de ruptura y la barrera izquierda (en la posición ) es mayor que . Asi quek ( x , 1 ) x x xΔ1>xk(x,1)xxx
P(Δ2>x|Δ1>x)=P(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2. Expectativa
Para distribuciones con soporte finito, tenemos
E(X)=∫P(X>x)dx=1−∫P(X≤x)dx.
Integrando la distribución de , obtenemosΔ(k+1)
E(Δ(k+1))=1k+1∑j=1k+1(k+1j)(−1)j+1j=1k+1∑j=1k+11j.
La última igualdad es una representación clásica de números armónicos , que demostramos a continuación.Hi=1+12+…+1i
Hk+1=∫101+x+…+xkdx=∫101−xk+11−xdx.
Con el cambio de la variable y expandiendo el producto, obtenemosu=1−x
Hk+1=∫10∑j=1k+1(k+1j)(−1)j+1uj−1du=∑j=1k+1(k+1j)(−1)j+1j.
3. Construcción alternativa de separaciones uniformes.
Para obtener la distribución asintótica del fragmento más grande, necesitaremos exhibir una construcción clásica de espacios uniformes como variables exponenciales divididas por su suma. La densidad de probabilidad de las estadísticas de orden asociadas es(U(1),…,U(k))
fU(1),…U(k)(u(1),…,u(k))=k!,0≤u(1)≤…≤u(k+1).
Si denotamos los espaciamientos uniformes , con , obtenemos U ( 0 ) = 0Δi=U(i)−U(i−1)U(0)=0
fΔ1,…Δk(δ1,…,δk)=k!,0≤δi+…+δk≤1.
Al definir , obtenemos asíU(k+1)=1
fΔ1,…Δk+1(δ1,…,δk+1)=k!,δ1+…+δk=1.
Ahora, sea ser IID variables aleatorias exponenciales con media 1, y sea . Con un simple cambio de variable, podemos ver queS = X 1 + … + X k + 1(X1,…,Xk+1)S=X1+…+Xk+1
fX1,…Xk,S(x1,…,xk,s)=e−s.
Defina , de modo que mediante un cambio de variable obtengamosYi=Xi/S
fY1,…Yk,S(y1,…,yk,s)=ske−s.
Integrando esta densidad con respecto a , obtenemos asís
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds=k!,0≤yi+…+yk≤1,and thusfY1,…Yk+1,(y1,…,yk+1)=k!,y1+…+yk+1=1.
Entonces la distribución conjunta de espaciamientos uniformes en el intervalo es la misma que la distribución conjunta de variables aleatorias exponenciales divididas por su suma. Llegamos a la siguiente equivalencia de distribuciónk+1(0,1)k+1
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4. Distribución asintótica.
Usando la equivalencia anterior, obtenemos
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
donde . Esta variable desaparece en probabilidad porque y . Asintóticamente, la distribución es la misma que la de . Debido a que los son IID, tenemosTk+1=X1+…+Xk+1k+1−1E(Tk+1)=0Var(log(k+1)Tk+1)=(log( k + 1 ) )2k + 1↓ 0X( k + 1 )- registro( k + 1 )Xyo
PAGS( X( k + 1 )- registro( k + 1 ) ≤ x )= P( X1≤ x + log( k + 1 ) )k + 1= ( 1 - e- x - log( k + 1 ))k + 1= ( 1 - e- xk + 1)k + 1∼ exp{ - e- x} .
5. Resumen gráfico
La siguiente gráfica muestra la distribución del fragmento más grande para diferentes valores de . Para , también he superpuesto la distribución asintótica de Gumbel (línea delgada). El Gumbel es una muy mala aproximación para valores pequeños de así que los omito para no sobrecargar la imagen. La aproximación de Gumbel es buena desde .kk = 10 , 20 , 50kk ≈ 50
6. Referencias
Las pruebas anteriores se toman de las referencias 2 y 3. La literatura citada contiene muchos más resultados, como la distribución de los espacios ordenados de cualquier rango, su distribución límite y algunas construcciones alternativas de los espacios uniformes ordenados. Las referencias clave no son fácilmente accesibles, por lo que también proporciono enlaces al texto completo.
- Bairamov y col. (2010) Límite de resultados para espaciamiento uniforme ordenado , Stat papers, 51: 1, pp 227-240
- Holst (1980) En las longitudes de las piezas de un palo roto al azar , J. Appl. Prob., 17, págs. 623-634
- Pyke (1965) Spacings , JRSS (B) 27: 3, págs. 395-449
- Renyi (1953) Sobre la teoría de las estadísticas del orden , Acta math Hung, 4, pp 191-231