Habrá un número infinito de distribuciones que se parecen mucho a su dibujo, con una variedad de valores diferentes para la curtosis.
Con las condiciones particulares en su pregunta y dado, mantenemos el punto de cruce para estar adentro, o al menos no muy lejos afuera±1, debe darse el caso de que tenga una curtosis un poco más grande que la normal. Mostraré tres casos donde eso sucede, y luego mostraré uno donde es más pequeño , y explicaré qué hace que suceda.
Dado que ϕ(x) y Φ(x) son los estándares normales pdf y cdf respectivamente, escribamos una pequeña función
f(x)={ϕ(x)a+b.g(x);|x|>t;|x|≤t
para alguna densidad simétrica continua g (con el cdf correspondiente G), con media 0, de modo que y .b=Φ(t)–½–t.ϕ(t)G(t)–½–t.g(t)a=ϕ(t)−b.g(t)
Es decir, y se eligen para hacer que la densidad sea continua e integrarse a .ab1
Ejemplo 1 Considerey,g(x)=3ϕ ( 3 x )t = 1
que se parece a tu dibujo, aquí generado por el siguiente código R:
f <- function(x, t=1,
dg=function(x) 2*dnorm(2*x),
pg=function(x) pnorm(2*x),
b=(pnorm(t) - 0.5 - t*dnorm(t))/ (pg(t) - 0.5 - t*dg(t)),
a=dnorm(t)-b*dg(t) ) {
ifelse(abs(x)>t,dnorm(x),a+b*dg(x))
}
f1 <- function(x) f(x,t=1,dg=function(x) 3*dnorm(3*x),pg=function(x) pnorm(3*x))
curve(f1,-4,4,col=2)
lines(x,dnorm(x),col=3)
Ahora los cálculos. Hagamos una función para evaluar :XpagsF1( x )
fp <- function(x,p=2) x^p*f1(x)
para que podamos evaluar los momentos. Primero la varianza:
integrate(fp,-Inf,Inf) # should be just smaller than 1
0.9828341 with absolute error < 1.4e-07
Luego el cuarto momento central:
integrate(fp,-Inf,Inf,p=4) # should be just smaller than 3
2.990153 with absolute error < 8.3e-06
Necesitamos la proporción de esos números, que debe tener una precisión de aproximadamente 5 cifras
integrate(fp,-Inf,Inf,p=4)$value/(integrate(fp,-Inf,Inf)$value^2)
[1] 3.095515
Entonces la curtosis es aproximadamente 3.0955, un poco más grande que para el caso normal.
Por supuesto, podríamos calcularlo algebraicamente y obtener una respuesta exacta, pero no hay necesidad, esto nos dice lo que queremos saber.
Ejemplo 2 Con la funcióndefinida anteriormente, podemos probarla para todo tipo de's.Fsol
Aquí está el Laplace:
library(distr)
D <- DExp(rate = 1)
f2 <- function(x) f(x,t=1,dg=d(D),pg=p(D))
curve(f2,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp2 <- function(x,p=2) x^p*f2(x)
integrate(fp2,-Inf,Inf) # should be just smaller than 1
0.9911295 with absolute error < 1.1e-07
integrate(fp2,-Inf,Inf,p=4) # should be just smaller than 3
2.995212 with absolute error < 5.9e-06
integrate(fp2,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.049065
Como era de esperar, un resultado similar.
Ejemplo 3 : Consideremos quees una distribución de Cauchy (una distribución de Student-t con 1 df), pero con escala 2/3 (es decir, sies un Cauchy estándar,, y nuevamente establezca el umbral, t (dando los puntos,, fuera de los cuales 'cambiamos' a la normalidad), a ser 1.solh ( x )sol( x ) = 1.5 h ( 1.5 x )± t
dg <- function(x) 1.5*dt(1.5*x,df=1)
pg <- function(x) pt(1.5*x,df=1)
f3 <- function(x) f(x,t=1,dg=dg,pg=pg)
curve(f3,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp3 <- function(x,p=2) x^p*f3(x)
integrate(fp3,-Inf,Inf) # should be just smaller than 1
0.9915525 with absolute error < 1.1e-07
integrate(fp3,-Inf,Inf,p=4) # should be just smaller than 3
2.995066 with absolute error < 6.2e-06
integrate(fp3,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.048917
Y solo para demostrar que realmente tenemos una densidad adecuada:
integrate(f3,-Inf,Inf)
1 with absolute error < 9.4e-05
Ejemplo 4 : Sin embargo , ¿qué sucede cuando cambiamos t ?
Tome y como el ejemplo anterior, pero cambie el umbral a :solsolt = 2
f4 <- function(x) f(x,t=2,dg=dg,pg=pg)
curve(f4,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp4 <- function(x,p=2) x^p*f4(x)
integrate(fp4,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 2.755231
¿Como sucedió esto?
Bueno, es importante saber que la curtosis es (hablando ligeramente) la varianza al cuadrado sobre :μ ± σ
Las tres distribuciones tienen la misma media y varianza.
La curva negra es la densidad normal estándar. La curva verde muestra una distribución bastante concentrada sobre (es decir, la varianza sobre es pequeña, lo que lleva a una curtosis que se aproxima a 1, la más pequeña posible). La curva roja muestra un caso en el que la distribución se "aleja" de ; esa es la curtosis es grande.μ ± σμ ± σμ ± σ
Con eso en mente, si establecemos los puntos de umbral lo suficientemente fuera de , podemos empujar la curtosis por debajo de 3 y aún así tener un pico más alto.μ ± σ