Intervalo de confianza en una cantidad aleatoria?


8

Supongamos que es un vector desconocido , y uno observa . Me gustaría calcular los intervalos de confianza en la cantidad aleatoria , basándose solo en el observado y el parámetro conocido . Es decir, para un dado , encuentre modo que .unapbN(a,I)siunasipagsα(0 0,1)C(si,pags,α)PAGSr(siunaC(si,pags,α))=α

Esta es una pregunta extraña porque la aleatoriedad que contribuye a los intervalos de confianza también afecta a . El enfoque directo es afirmar que, condicional en , , por lo tanto , pero no creo que esto dé un CI adecuado porque está sesgado para , que es el valor esperado de . ( es, hasta escala, un RV de chi-cuadrado no central, con un parámetro de no centralidad dependiendo desisiunanorte(si,yo)siunanorte(sisi,sisiyo)sisiunaunasiunasisiunauna ; su valor esperado no es .)unauna

nota : incondicionalmente, y , lo que significa que es una variable aleatoria de chi-cuadrado no central. Por lo tanto, es una estimación imparcial de la media de y de su varianza. ¡Esto último es algo inútil, ya que puede ser negativo!siunanorte(unauna,unauna)sisiχ(pags,unauna)sisi-pagsunasi

Estoy buscando todas y cada una de las formas sensatas de abordar este problema. Estos pueden incluir:

  1. Un límite de confianza adecuado, que es una función del observado y conocido tal que para todos y todos modo que . Edite Lo que quiero decir con esto es que, si arregló y luego dibujó un aleatorio , la probabilidad de que es bajo sorteos repetidos de . Entonces, por ejemplo, siCsipagsPAGSr(siunaC(si,pags,α))=ααunaunauna>0 0unasisiuna-C(si,pags,α)0 0αsiunay luego dibujó independiente , luego la proporción de tal que se acercaría como el número de réplicas va a .siyoyosiyounaC(siyo,pags,α)α
  2. Una confianza ligada 'en expectativa'. Esta es una función de la observada , y de y conocidos, de modo que su valor esperado incondicional es el cuantil de para todos .sipagsααsiunauna:unauna>0 0
  3. Algún tipo de solución bayesiana en la que pueda especificar un previo sano en , luego, dada la observación , obtenga un posterior en ambos yunaunasisisiunauna.

editar La forma original de esta pregunta tenía la covarianza desi como 1norteyo, sin embargo, creo que wlog uno puede asumirnorte=1, así que he editado toda mención de norte.


Los "intervalos de confianza" en cantidades aleatorias generalmente se denominan "intervalos de predicción".
kjetil b halvorsen

1
@kjetilbhalvorsen: esta no es una pregunta con respecto a los intervalos de predicción, que estiman "un intervalo en el que caerán las observaciones futuras", según Wikipedia. El vectorsiha ya sido observado.
shabbychef

1
No puedo ver como pagsentra en esto en absoluto. ¿Puedes por favor aclarar?
Ben - Restablece a Mónica el

1
@Ben pags es la longitud de los vectores una y si.
shabbychef

Respuestas:


5

Vista geométrica del problema y distribuciones de siuna y El |siEl |2

A continuación se muestra una vista geométrica del problema. La dirección deuna realmente no importa y solo podemos usar las longitudes de estos vectores El |unaEl | y El |siEl | que dan toda la información necesaria.

vista geométrica

La distribución de la longitud de la proyección vectorial de si sobre una estarán siuna/ /El |unaEl |norte(El |unaEl |,1) que está relacionado con la cantidad que estás buscando

siunanorte(El |unaEl |2,El |unaEl |2)

Podemos deducir aún más que la longitud al cuadrado del vector de muestras El |siEl |2tiene la distribución una distribución chi-cuadrado no central , con los grados de libertadpags y el parámetro de no centralidad k=1pagsμk2=El |unaEl |2

El |siEl |2χpags,El |unaEl |22

además

(El |siEl |2-(siuna)2El |unaEl |2)condicional en siuna y El |unaEl |2χpags-12

Esta última expresión muestra que el intervalo estimado para siuna puede , desde cierto punto de vista, ser visto como un intervalo de confianza, porquesiuna puede verse como un parámetro en la distribución de El |siEl |2. Pero es complicado porque hay un parámetro molestoEl |unaEl |2y también el parámetro siuna es una variable aleatoria relacionada con El |unaEl |2.

Gráficos de distribuciones y algún método para definir un C(si,pags,α)

trama de distribuciones conjuntas

En la imagen de arriba, trazamos una región del 95% usando la derecha β1 parte de la distribución de norte(El |unaEl |2,El |unaEl |2) y la parte superior β2 parte de la distribución desplazada de χpags-12 tal que β1β2=0,05

Ahora el gran truco es dibujar alguna línea C(El |βEl |2,pags,α)que limita los puntos de tal manera que para cualquier una hay una fracción 1-αde los puntos (al menos) que están debajo de la línea.

múltiple a

Debajo de la línea es donde la región tiene éxito y queremos que esto suceda al menos fracción 1-αdel tiempo. (véase también La lógica básica de construir un intervalo de confianza y ¿Podemos rechazar una hipótesis nula con intervalos de confianza producidos mediante muestreo en lugar de la hipótesis nula? para un razonamiento análogo pero en un entorno más simple).

Puede ser dudoso que podamos tener éxito para resolver la situación:

El |unaEl |:PAGSr(siunaC(si,pags,α))=α

Pero siempre deberíamos poder obtener algún resultado como

El |unaEl |:PAGSr(siunaC(si,pags,α))α

o más estrictamente el límite superior mínimo de todos los PAGSr(siunaC(si,pags,α)) es igual a α

cenar{PAGSr(siunaC(si,pags,α)):El |unaEl |0 0}=α

Para la línea en la imagen con el múltiple El |unaEl | Usamos la línea que toca los picos de las regiones individuales para definir la función C(El |siEl |,pags,α). Al usar estos picos, obtenemos que las regiones originales, que estaban destinadas a serα=β1β2No están cubiertos de manera óptima. En cambio, menos puntos caen debajo de la línea (entoncesα>β1β2) Para pequeñosEl |unaEl | estos serán la parte superior, y para grandes El |unaEl |Esta será la parte correcta. Entonces obtendrás:

El |unaEl |<<1:PAGSr(siunaC(si,pags,α))β2El |unaEl |>>1:PAGSr(siunaC(si,pags,α))β1

y

cenar{PAGSr(siunaC(si,pags,α)):El |unaEl |0 0}max(β1,β2)

Así que esto todavía es un poco de trabajo en progreso. Una posible forma de resolver la situación podría ser tener alguna función paramétrica que sigas mejorando iterativamente por prueba y error, de modo que la línea sea más constante (pero no sería muy perspicaz). O posiblemente se podría describir alguna función diferencial para la línea / función.

alfa efectivo

# find limiting 'a' and a 'b dot a'  as function of b² 
f <- function(b2,p,beta1,beta2) {
  offset <- qchisq(1-beta2,p-1)
  qma <- qnorm(1-beta1,0,1)
  if (b2 <= qma^2+offset) {
    xma = -10^5
  } else {
    ysup <- b2 - offset - qma^2
    alim <- -qma + sqrt(qma^2+ysup) 
    xma <- alim^2+qma*alim
  }
    xma
}  
fv <- Vectorize(f)  

# plot boundary
b2 <- seq(0,1500,0.1)
lines(fv(b2,p=25,sqrt(0.05),sqrt(0.05)),b2)


# check it via simulations
dosims <- function(a,testfunc,nrep=10000,beta1=sqrt(0.05),beta2=sqrt(0.05)) {
  p <- length(a)
  replicate(nrep,{
    bee <- a + rnorm(p)
    bnd <- testfunc(sum(bee^2),p,beta1,beta2)
    bta <- sum(bee * a)
    bta <= bnd
  })
}

mean(dosims(c(1,rep(0,7)),fv))

### plotting
# vectors of |a| to be tried
las2 <- 2^seq(-10,10,0.5) 
# different values of beta1 and beta2
y1 <- sapply(las2,FUN = function(las2) 
  mean(dosims(c(las2,rep(0,24)),fv,nrep=50000,beta1=0.2,beta2=0.2)))
y2 <- sapply(las2,FUN = function(las2) 
  mean(dosims(c(las2,rep(0,24)),fv,nrep=50000,beta1=0.4,beta2=0.1)))
y3 <- sapply(las2,FUN = function(las2) 
  mean(dosims(c(las2,rep(0,24)),fv,nrep=50000,beta1=0.1,beta2=0.4)))

plot(-10,-10,
     xlim=c(10^-3,10^3),ylim=c(0,0.5),log="x",
     xlab = expression("|a|"), ylab = expression(paste("effective ", alpha)))

points(las2,y1, cex=0.5, col=1,bg=1, pch=21)
points(las2,y2, cex=0.5, col=2,bg=2, pch=21)
points(las2,y3, cex=0.5, col=3,bg=3, pch=21)

text(0.001,0.4,expression(paste(beta[2], " = 0.4   ", beta[1], " = 0.1")),pos=4)
text(0.001,0.25,expression(paste(beta[2], " = 0.2   ", beta[1], " = 0.2")),pos=4)
text(0.001,0.15,expression(paste(beta[2], " = 0.1   ", beta[1], " = 0.4")),pos=4)

title(expression(paste("different effective ", alpha, " for different |a|"))) 

Como si es aleatorio, la función F(si,pags,α)También es aleatorio. No obstante, creo que se puede construir una función tal que la declaración de probabilidad se mantenga bajo la replicación del experimento (para un método fijouna)
shabbychef

Una forma de responder la pregunta sería encontrar la función F tal que PAGS(siunaF(si,pags,α))=α, donde la replicación está bajo un fijo una, pero realizaciones independientes de si. En realidad, sin embargo, solo observaremos unosi. (Darse cuenta de quesisí es probable que sea un estadístico suficiente reescalado calculado sobre una serie de realizaciones independientes de un experimento).
shabbychef

Vea también mi 'respuesta', que muestra que para grandes unauna, cierta estadística es casi Normal, mientras que para valores pequeños de este parámetro, es más como un Chi-cuadrado (desplazado, reescalado) no central. Dicho esounaes un parámetro de población desconocido, por lo que no sabemos cuál es el correcto. Podemos estimarunauna de la cantidad sisi, sin embargo.
shabbychef

No veo por qué importa eso siestá a ambos lados de la ecuación. Sin embargo, intentaré editar la pregunta una vez más para que quede perfectamente claro.
shabbychef

1
Publiqué una respuesta falsa con código real.
shabbychef

3

Cambiaré la notación a algo más familiar. Espero que no sea confuso.

No veo cómo se podría estimar el C-función con un estimador completamente imparcial. Pero proporcionaré un estimador imparcial para "parte" de laC-función, y proporciona una fórmula para el sesgo restante, de modo que pueda evaluarse mediante simulación.

Asumimos que tenemos una normalidad conjunta pagsvector aleatorio (columna) tridimensional

Xnorte(μ,1norteyopags),μ=(μ1,...,μpags)

Por la especificación de la matriz de covarianza, los elementos del vector aleatorio son independientes.

Estamos interesados ​​en la variable aleatoria univariante Y=Xμ. Debido a la normalidad articular, esta variable también tiene una distribución normal.

Ynorte(μμ,1norteμμ)

Por lo tanto

PAGS(norteY-μμμμnorteC-μμμμ)=Φ(norteC-μμμμ)

dónde Φ() es el CDF normal estándar y

Φ(ncμμμμ)=αncμμμμ=Φ1(α)=zα

(1)c=μμnza+μμ

Por lo tanto, necesitamos obtener estimaciones para μμy su raíz cuadrada. Para cada elemento del vectorxdecir Xk tenemos norte observaciones iid disponibles, {xk1,...,xkn}. Entonces, para cada elemento deμμ=(μ12,...,μp2) probemos el estimador

Est(μk2)=1norteyo=1norteXkyo2

Este estimador tiene valor esperado

mi(1norteyo=1norteXkyo2)=1norteyo=1nortemi(Xkyo2)=1norteyo=1norte(Var(Xkyo)+[mi(Xkyo)]2)

mi(μk2^)=1norteyo=1norte(1norte+μk2)=1norte+μk2

Entonces un estimador imparcial paraμkyo2 es

μk2^=1norteyo=1norteXkyo2-1norte

implicando que

mi[k=1pags(1norteyo=1norteXkyo2-1norte)]=1nortemi(k=1pagsyo=1norteXkyo2)-pagsnorte=μμ

y asi que

(2)θ^1nortek=1pagsyo=1norteXkyo2-pagsnorte
es un estimador imparcial de μμ.

Pero un estimador imparcial para μμ no parece existir (uno que se base únicamente en las cantidades conocidas, es decir).

Así que supongamos que seguimos y estimamos C por

(3)C^=θ^nortezuna+θ^

El sesgo de este estimador es

si(C^)=mi(C^-C)=zαnorte[mi(θ^)-μμ]>0 0

el resultado de "sesgo positivo" debido a la desigualdad de Jensen.

En este enfoque, el tamaño norte de la muestra es crítica, ya que reduce el sesgo para cualquier valor dado de μ.

¿Cuáles son las consecuencias de este sesgo de sobreestimación? Supongamos que se nos danorte,pags, y se nos dice que calculemos el valor crítico para Y por probabilidad α, PAGS(YC)=α.

Dada una secuencia de muestras, proporcionaremos una estimación C^ para lo cual, "en promedio" C^>C.

En otras palabras

PAGS(Ymi(C^))=α>α=PAGS(YC)

Se podría evaluar por simulación la magnitud del sesgo para varios valores de μ, y cómo y cuánto distorsiona los resultados.


Creo que esto es hacia un CI imparcial (opción 2 en mi edición), y similar en espíritu a mi respuesta insatisfactoria. Pensaré cómo podría construirse una mejor estimación de la desviación estándar con la información disponible. Creo que tal vez una serie de Taylor podría funcionar. Además, no estoy seguro acerca denorte observaciones de Xparte. Tenemosn=1 sin pérdida de generalidad .
shabbychef

Como puede ver, el valor de norteimporta cuando se trata de prejuicios. Por lo tanto, depende de lo que quiera decir con "sin pérdida de generalidad". Una cuestión más práctica es que si se proporcionaran las fórmulas paranorte=1, no sería necesariamente claro cómo exactamente deberían buscar norte. Ahora se proporcionan para generalnorte para poder conectar cualquier valor de norte, y ver qué pasa
Alecos Papadopoulos

El problema es que no hay norte; Solo fue relevante para dar el trasfondo del problema, y ​​debería borrarlo de la pregunta. Solo observas un solo si (en su terminología, X, con norte=1)
shabbychef

Eso no crea ningún problema. Solo inserte1 donde quiera norteAparece en mis fórmulas.
Alecos Papadopoulos

1

Un enfoque que casi funciona es el siguiente: tenga en cuenta que (sisi-siuna)/ /sisi 'parece' zC, dónde C es un vector de longitud unitaria (en realidad es si escalado a la longitud de la unidad), y z=si-unanorte(0 0,yo). Si fuera el caso queC eran independientes de z, entonces uno podría afirmar que sisi+Zαsisi era un α confianza confinada, donde Zα es el α cuantil de lo normal.

Sin embargo, Cno es independiente dez. Tiende a estar 'alineado con'z. Ahora, cuandounauna1, Ces esencialmente independiente, y la confianza vinculada anteriormente brinda una cobertura adecuada. Cuando0 0<unauna1, sin embargo, zC es más como una variable aleatoria chi-cuadrado desplazada, escalada y no central.

Una pequeña simulación R muestra los efectos de unauna en la normalidad de la cantidad (sisi-siuna)/ /sisi:

z.sim <- function(p,eff.size,nsim=1e5) {
    a <- matrix(eff.size * rnorm(p),nrow=p)
    b <- rep(a,nsim) + matrix(rnorm(p*nsim),nrow=p)
    atb <- as.matrix(t(a) %*% b)
    btb <- matrix(colSums(b * b),nrow=1)
    isZ <- (btb - atb) / sqrt(btb)
}

set.seed(99) 
isZ <- z.sim(6,1e3)
jpeg("isZ.jpg")
qqnorm(isZ)
qqline(isZ)
dev.off()

jpeg("isChi.jpg")
isZ <- z.sim(6,1e-3)
qqnorm(isZ)
qqline(isZ)
dev.off()

un gran caso un pequeño caso


Esto se ve como un plegado multivariado normal para mí ...
shabbychef

Esto no funcionará porque la distribución depende de lo desconocido. unauna. Quizás uno podría establecer un previo en esta cantidad que conduciría a un posterior enunasi.
shabbychef

1

Para el caso pags=1, podemos encontrar un intervalo de dos lados. En este caso podemos suponer que0 0<una es el parámetro de población, y observamos si=norte(una,1). Deseamos enlazar unasi en probabilidad con alguna función de El |siEl | (Solo podemos usar el valor absoluto de si ya que es el análogo unidimensional de sisi Para el pags>1 caso.)

Dejar ϕ ser la función de densidad normal, y dejar zα/ /2 ser el α/ /2cuantil de lo normal. Entonces, trivialmente

-ϕ(si-una)yo{El |una-siEl |-zα/ /2}resi=α.
Ahora tenga en cuenta que El |una-siEl | es invariante con respecto a la multiplicación del interior por ±1, entonces podemos multiplicar por firmar(si). Es decirEl |una-siEl |=El |unafirmar(si)-El |siEl |El |. Usando esto, luego multiplicando las cantidades por El |siEl | tenemos:
α=PAGS(El |unafirmar(si)-El |siEl |El |-zα/ /2),=PAGS(El |unasi-si2El |-zα/ /2El |siEl |),=PAGS(unasi[si2+zα/ /2El |siEl |,si2-zα/ /2El |siEl |]).

Así, el intervalo simétrico [si2+zα/ /2El |siEl |,si2-zα/ /2El |siEl |] tiene 1-α cobertura de unasi.

Probemos con el código:

test_ci <- function(a,nsim=100000,alpha=0.05) {
  b <- rnorm(nsim,mean=a,sd=1)
  b_lo <- b^2 + abs(b) * qnorm(alpha/2)
  b_hi <- b^2 + abs(b) * qnorm(alpha/2,lower.tail=FALSE)
  ab <- a*b
  isout <- ab < b_lo | ab > b_hi
  mean(isout) 
}
# try twice, with a 'small' and with a 'large'
set.seed(1234)
test_ci(a=0.01)
set.seed(4321)
test_ci(a=3.00)

Obtengo la tasa nominal de 0.05 tipo I:

[1] 0.04983
[1] 0.04998

No está claro cómo convertir esto en una solución para el pags>1 caso, pero supongo algo de trigonometría y uso del t Se aplicará la distribución.


0

De nuevo, la pregunta es encontrar la función C() tal que, si arreglaste una, entonces debajo metro sorteos independientes de siyo=una+zyo, la proporción de yo tal que siyounaC(siyo,pags,α) debería ir a α como metro.

Daré una solución rota para ilustrar cómo debería funcionar esto en el código. Primera nota quesisi es un chi-cuadrado no central con parámetro de no centralidad λ=unauna y df pags. Entonces tenemos

mi[sisi]=pags+unauna.
Ahora tenga en cuenta que siunanorte(unauna,unauna). Entonces en particular,
mi[sisi-siuna-pags]=0.
Ignorando la covarianza de siuna y sisi(bajo mi propio riesgo), puedo afirmar erróneamente que la variación de esta cantidad es
Var[sisi-siuna-pags]=unauna+2(pags+2unauna)=2pags+5 5unauna.
Al unirlos, puedo hacer la afirmación extravagante y ridícula de que el α cuantil de sisi-siuna-pags esta alrededor
Zα2pags+5 5unauna.
Entonces podría concluir incorrectamente que
PAGSr(siunasisi-pags+Zα2pags+5 5unauna)α.
Ya que no se una, Podría sustituir aún más en la expectativa de sisi llegar a
C(si,pags,α)=sisi-pags+Zα0 0(5 5sisi-3pags),
teniendo cuidado, por supuesto, para evitar estimar una desviación estándar negativa .

Esto ciertamente no va a funcionar porque ignoramos el término de covarianza. Sin embargo, el punto es demostrar algo de código:

# my broken 'c' function
cfunc <- function(bee,p=length(bee),alpha=0.05) {
  lam <- sum(bee^2)
  sig <- sqrt(max(0,5*lam - 3*p))
  lam - p + qnorm(alpha) * sig
}
# check it via simulations
dosims <- function(a,testfunc,nrep=10000,alpha=0.05) {
  p <- length(a)
  replicate(nrep,{
    bee <- a + rnorm(p)
    bnd <- testfunc(bee,p,alpha)
    bta <- sum(bee * a)
    bta <= bnd
  })
}
options(digits=5)
set.seed(1234)
mean(dosims(rep(0.01,8),cfunc))
mean(dosims(rep(0.1,8),cfunc))
mean(dosims(rep(1,8),cfunc))

No obtengo nada como el nominal 0,05 cobertura:

[1] 0.0011
[1] 0.0018
[1] 0.001

Debería poder conectar una confianza de trabajo destinada a testfunc.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.