Mientras estudiaba sobre la suficiencia, me encontré con su pregunta porque también quería entender la intuición acerca de lo que deduje de esto es lo que se me ocurrió (hágame saber lo que piensa, si cometí algún error, etc.).
Sea una muestra aleatoria de una distribución de Poisson con media θX1,…,Xnθ>0 .
Sabemos que es una estadística suficiente para θ , ya que la distribución condicional de X 1 , ... , X n dado T ( X ) está libre de θT(X)=∑ni=1XiθX1,…,XnT(X)θ , en otras palabras, no depende de .θ
Ahora, el estadístico sabe que X 1 , ... , X n i . yo . d ∼ P o i s s o n ( 4 ) y crea n = 400 valores aleatorios a partir de esta distribución:A X1,…,Xn∼i.i.dPoisson(4)n=400
n<-400
theta<-4
set.seed(1234)
x<-rpois(n,theta)
y=sum(x)
freq.x<-table(x) # We will use this latter on
rel.freq.x<-freq.x/sum(freq.x)
Para los valores que ha creado el estadístico , toma la suma y le pregunta al estadístico B lo siguiente:AB
"Tengo estos valores de muestra tomados de una distribución de Poisson. Sabiendo que ∑ n i = 1 x i = yx1,…,xn∑ni=1xi=y=4068 , ¿qué me puede decir acerca de esta distribución?"
∑ni=1xi=y=4068Bθ ? Como sabemos que esta es una estadística suficiente, sabemos que la respuesta es "sí".
Para tener alguna idea sobre el significado de esto, hagamos lo siguiente (tomado de "Introducción a las estadísticas matemáticas" de Hogg & Mckean & Craig, 7ª edición, ejercicio 7.1.9):
Bz1,z2,…,znxZ1,Z2…,Znz1,z2,…,zn∑zi=y
θz1e−θz1!θz2e−θz2!⋯θzne−θzn!nθye−nθy!=y!z1!z2!⋯zn!(1n)z1(1n)z2⋯(1n)zn
Y=∑Zinθyn1/nByz1,…,zn
Esto es lo que dice el ejercicio. Entonces, hagamos exactamente eso:
# Fake observations from multinomial experiment
prob<-rep(1/n,n)
set.seed(1234)
z<-as.numeric(t(rmultinom(y,n=c(1:n),prob)))
y.fake<-sum(z) # y and y.fake must be equal
freq.z<-table(z)
rel.freq.z<-freq.z/sum(freq.z)
Zk=0,1,…,13
# Verifying distributions
k<-13
plot(x=c(0:k),y=dpois(c(0:k), lambda=theta, log = FALSE),t="o",ylab="Probability",xlab="k",
xlim=c(0,k),ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(8,0.2, legend=c("Real Poisson","Random Z given y"),
col = c("black","green"),pch=c(1,4))
θY= ∑ Xyonorte
XZEl | y
plot(rel.freq.x,t="o",pch=16,col="red",ylab="Relative Frequency",xlab="k",
ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(7,0.2, legend=c("Random X","Random Z given y"), col = c("red","green"),pch=c(16,4))
Vemos que también son bastante similares (como se esperaba)
Xyo Y= X1+ X2+ ⋯ + Xnorte " (Ash, R. "Inferencia estadística: Un curso conciso ", página 59).