Encontrar una manera de simular números aleatorios para esta distribución

20

Estoy tratando de escribir un programa en R que simule números pseudoaleatorios de una distribución con la función de distribución acumulativa:

F (x) = 1 - \exp (- a x - \frac{b}{p + 1} x^{p + 1}), x \geq 0

$F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0$

donde $a,b>0, p \in (0,1)$

Intenté el muestreo de transformación inversa pero el inverso no parece ser analíticamente solucionable. Me alegraría si pudiera sugerir una solución a este problema

r random-generation

— Sebastian
fuente

1

No hay tiempo suficiente para una respuesta completa, pero puede verificar los algoritmos de Muestreo de importancia, como alternativa.

— chuse

1

no es un ejercicio de libro de texto, solo estipulé la restricción porque es una suposición razonable para mis datos

— Sebastian

66

Luego me sorprende la normalización "milagrosa" por

(p + 1)^{- 1}

$(p+1)^{-1}$ que convierte la distribución en un poder perfecto de un exponencial, pero los milagros suceden (con poca probabilidad).

— Xi'an

49

Hay una solución directa (y si puedo agregar, elegante) a este ejercicio: dado que $1-F(x)$ aparece como un producto de dos distribuciones de supervivencia:

(1 - F (x)) = \exp {- a x - \frac{b}{p + 1} x^{p + 1}} = \underset{1 - F_{1} (x)}{\underset{⏟}{\exp {- a x}}} \underset{1 - F_{2} (x)}{\underset{⏟}{\exp {- \frac{b}{p + 1} x^{p + 1}}}}

$(1-F(x))=\exp\left\{-ax-\frac{b}{p+1}x^{p+1}\right\}=\underbrace{\exp\left\{-ax\right\}}_{1-F_1(x)}\underbrace{\exp\left\{-\frac{b}{p+1}x^{p+1}\right\}}_{1-F_2(x)}$

F

$F$

X = min {X_{1}, X_{2}} X_{1} \sim F_{1}, X_{2} \sim F_{2}

$X=\min\{X_1,X_2\}\qquad X_1\sim F_1\,,X_2\sim F_2$

F_{1}

$F_1$

E (a)

$\mathcal{E}(a)$

F_{2}

$F_2$

1 / (p + 1)

$1/(p+1)$

E (b / (p + 1))

$\mathcal{E}(b/(p+1))$

El código R asociado es tan simple como parece

x=pmin(rexp(n,a),rexp(n,b/(p+1))^(1/(p+1))) #simulating an n-sample

y definitivamente es mucho más rápido que el pdf inverso y las resoluciones de aceptar-rechazar:

> n=1e6
> system.time(results <- Vectorize(simulate,"prob")(runif(n)))
utilisateur     système      écoulé 
    89.060       0.072      89.124 
> system.time(x <- simuF(n,1,2,3))
utilisateur     système      écoulé 
     1.080       0.020       1.103 
> system.time(x <- pmin(rexp(n,a),rexp(n,b/(p+1))^(1/(p+1))))
utilisateur     système      écoulé 
     0.160       0.000       0.163

con un ajuste sorprendentemente perfecto:

— Xi'an
fuente

55

solución realmente genial!

— Sebastián

14

Siempre puede resolver numéricamente la transformación inversa.

A continuación, hago una búsqueda de bisección muy simple. Para una probabilidad de entrada dada (uso ya que ya tiene una en su fórmula), comienzo con y . Luego doblo hasta que . Finalmente, bisecciono iterativamente el intervalo hasta que su longitud es más corta que y su punto medio satisface . $q$ $q$ $p$ $x_L=0$ $x_R=1$ $x_R$ $F(x_R)>q$ $[x_L,x_R]$ $\epsilon$ $x_M$ $F(x_M)\approx q$

El ECDF se ajusta a su suficientemente bien como para mis elecciones de y , y es razonablemente rápido. Probablemente podría acelerar esto usando alguna optimización de tipo Newton en lugar de la simple búsqueda de bisección. $F$ $a$ $b$

aa <- 2
bb <- 1
pp <- 0.1

cdf <- function(x) 1-exp(-aa*x-bb*x^(pp+1)/(pp+1))

simulate <- function(prob,epsilon=1e-5) {
    left <- 0
    right <- 1
    while ( cdf(right) < prob ) right <- 2*right

    while ( right-left>epsilon ) {
        middle <- mean(c(left,right))
        value_middle <- cdf(middle)
        if ( value_middle < prob ) left <- middle else right <- middle
    }

    mean(c(left,right))
}

set.seed(1)
results <- Vectorize(simulate,"prob")(runif(10000))
hist(results)

xx <- seq(0,max(results),by=.01)
plot(ecdf(results))
lines(xx,cdf(xx),col="red")

— S. Kolassa - Restablece a Monica
fuente

10

Existe una resolución un tanto intrincada si directa por aceptar-rechazar. Primero, una diferenciación simple muestra que el pdf de la distribución es Segundo, ya que tenemos el límite superior Tercero, considerando el segundo término en , tome el cambio de la variable , es decir, . Entonces es el jacobiano del cambio de variable. Si

f (x) = (a + b x^{p}) \exp {- a x - \frac{b}{p + 1} x^{p + 1}}

$f(x)=(a+bx^p)\exp\left\{-ax-\frac{b}{p+1}x^{p+1}\right\}$

f (x) = a e^{- a x} \underset{\leq 1}{\underset{⏟}{e^{- b x^{p + 1} / (p + 1)}}} + b x^{p} e^{- b x^{p + 1} / (p + 1)} \underset{\leq 1}{\underset{⏟}{e^{- a x}}}

$f(x)=ae^{-ax}\underbrace{e^{-bx^{p+1}/(p+1)}}_{\le 1}+bx^pe^{-bx^{p+1}/(p+1)}\underbrace{e^{-ax}}_{\le 1}$

f (x) \leq g (x) = a e^{- a x} + b x^{p} e^{- b x^{p + 1} / (p + 1)}

$f(x)\le g(x)=ae^{-ax}+bx^pe^{-bx^{p+1}/(p+1)}$

g

$g$

ξ = x^{p + 1}

$\xi=x^{p+1}$

x = ξ^{1 / (p + 1)}

$x=\xi^{1/(p+1)}$

\frac{d x}{d ξ} = \frac{1}{p + 1} ξ^{\frac{1}{p + 1} - 1} = \frac{1}{p + 1} ξ^{\frac{- p}{p + 1}}

$\dfrac{\text{d}x}{\text{d}\xi}=\dfrac{1}{p+1}\xi^{\frac{1}{p+1}-1}=\dfrac{1}{p+1}\xi^{\frac{-p}{p+1}}$

X

$X$ tiene una densidad de la forma donde es la constante de normalización, entonces tiene la densidad que significa que (i) es distribuido como una variante exponencial y (ii) la constante es igual a uno. Por lo tanto, termina siendo igual a la mezcla igualmente ponderada de una distribución Exponencial y la potencia de una Exponencial

κ b x^{p} e^{- b x^{p + 1} / (p + 1)}

$\kappa bx^pe^{-bx^{p+1}/(p+1)}$

κ

$\kappa$

Ξ = X^{1 / (p + 1)}

$\Xi=X^{1/(p+1)}$

κ b ξ^{\frac{p}{p + 1}} e^{- b ξ / (p + 1)} \frac{1}{p + 1} ξ^{\frac{- p}{p + 1}} = κ \frac{b}{p + 1} e^{- b ξ / (p + 1)}

$\kappa b\xi^{\frac{p}{p+1}}e^{-b\xi/(p+1)}\,\dfrac{1}{p+1}\xi^{\frac{-p}{p+1}}=\kappa \dfrac{b}{p+1}e^{-b\xi/(p+1)}$

Ξ

$\Xi$

E (b / (p + 1))

$\mathcal{E}(b/(p+1))$

κ

$\kappa$

g (x)

$g(x)$

E (a)

$\mathcal{E}(a)$

1 / (p + 1)

$1/(p+1)$

E (b / (p + 1))

$\mathcal{E}(b/(p+1))$ distribución, módulo una constante multiplicativa faltante de para tener en cuenta los pesos: Y es fácil de simular como una mezcla.

2

$2$

f (x) \leq g (x) = 2 (\frac{1}{2} a e^{- a x} + \frac{1}{2} b x^{p} e^{- b x^{p + 1} / (p + 1)})

$f(x)\le g(x)=2\left(\frac{1}{2} ae^{-ax}+\frac{1}{2} bx^pe^{-bx^{p+1}/(p+1)}\right)$

g

$g$

Una representación R del algoritmo de aceptación-rechazo es así

simuF <- function(a,b,p){
  reepeat=TRUE
  while (reepeat){
   if (runif(1)<.5) x=rexp(1,a) else
      x=rexp(1,b/(p+1))^(1/(p+1))
   reepeat=(runif(1)>(a+b*x^p)*exp(-a*x-b*x^(p+1)/(p+1))/
      (a*exp(-a*x)+b*x^p*exp(-b*x^(p+1)/(p+1))))}
  return(x)}

y para una muestra n:

simuF <- function(n,a,b,p){
  sampl=NULL
  while (length(sampl)<n){
   x=u=sample(0:1,n,rep=TRUE)
   x[u==0]=rexp(sum(u==0),b/(p+1))^(1/(p+1))
   x[u==1]=rexp(sum(u==1),a)
   sampl=c(sampl,x[runif(n)<(a+b*x^p)*exp(-a*x-b*x^(p+1)/(p+1))/
      (a*exp(-a*x)+b*x^p*exp(-b*x^(p+1)/(p+1)))])
   }
  return(sampl[1:n])}

Aquí hay una ilustración para a = 1, b = 2, p = 3:

— Xi'an
fuente