Esto debería resolverse fácilmente mediante inferencia bayesiana. Usted conoce las propiedades de medición de los puntos individuales con respecto a su valor verdadero y desea inferir la media de la población y la DE que generaron los valores verdaderos. Este es un modelo jerárquico.
Reformulación del problema (conceptos básicos de Bayes)
Tenga en cuenta que mientras que las estadísticas ortodoxas le dan una media única, en el marco bayesiano obtiene una distribución de valores creíbles de la media. Por ejemplo, las observaciones (1, 2, 3) con DE (2, 2, 3) podrían haber sido generadas por la Estimación de máxima verosimilitud de 2 pero también por una media de 2.1 o 1.8, aunque un poco menos probable (dados los datos) que el MLE Entonces, además de la DE, también inferimos la media .
Otra diferencia conceptual es que debe definir su estado de conocimiento antes de hacer las observaciones. Llamamos a esto priors . Es posible que sepa de antemano que se escaneó un área determinada y en un cierto rango de altura. La ausencia total de conocimiento sería tener grados uniformes (-90, 90) como los anteriores en X e Y y quizás metros uniformes (0, 10000) de altura (sobre el océano, debajo del punto más alto de la tierra). Debe definir distribuciones previas para todos los parámetros que desea estimar, es decir, obtener distribuciones posteriores para. Esto también es cierto para la desviación estándar.
Reformulando su problema, supongo que desea inferir valores creíbles para tres medias (X.mean, Y.mean, X.mean) y tres desviaciones estándar (X.sd, Y.sd, X.sd) que podrían tener generó sus datos
El modelo
Usando la sintaxis BUGS estándar (use WinBUGS, OpenBUGS, JAGS, Stan u otros paquetes para ejecutar esto), su modelo se vería así:
model {
# Set priors on population parameters
X.mean ~ dunif(-90, 90)
Y.mean ~ dunif(-90, 90)
Z.mean ~ dunif(0, 10000)
X.sd ~ dunif(0, 10) # use something with better properties, i.e. Jeffreys prior.
Y.sd ~ dunif(0, 10)
Z.sd ~ dunif(0, 100)
# Loop through data (or: set up plates)
# assuming observed(x, sd(x), y, sd(y) z, sd(z)) = d[i, 1:6]
for(i in 1:n.obs) {
# The true value was generated from population parameters
X[i] ~ dnorm(X.mean, X.sd^-2) #^-2 converts from SD to precision
Y[i] ~ dnorm(Y.mean, Y.sd^-2)
Z[i] ~ dnorm(Z.mean, Z.sd^-2)
# The observation was generated from the true value and a known measurement error
d[i, 1] ~ dnorm(X[i], d[i, 2]^-2) #^-2 converts from SD to precision
d[i, 3] ~ dnorm(Y[i], d[i, 4]^-2)
d[i, 5] ~ dnorm(Z[i], d[i, 6]^-2)
}
}
Naturalmente, usted monitorea los parámetros .mean y .sd y usa sus posteriores para inferencia.
Simulación
Simulé algunos datos como este:
# Simulate 500 data points
x = rnorm(500, -10, 5) # mean -10, sd 5
y = rnorm(500, 20, 5) # mean 20, sd 4
z = rnorm(500, 2000, 10) # mean 2000, sd 10
d = cbind(x, 0.1, y, 0.1, z, 3) # added constant measurement errors of 0.1 deg, 0.1 deg and 3 meters
n.obs = dim(d)[1]
Luego ejecutó el modelo usando JAGS para 2000 iteraciones después de una grabación de 500 iteraciones. Aquí está el resultado para X.sd.
El rango azul indica el 95% de mayor densidad posterior o intervalo creíble (donde cree que el parámetro es después de haber observado los datos. Observe que un intervalo de confianza ortodoxo no le proporciona esto).
La línea vertical roja es la estimación MLE de los datos sin procesar. Por lo general, el parámetro más probable en la estimación bayesiana es también el parámetro más probable (máxima verosimilitud) en las estadísticas ortodoxas. Pero no debes preocuparte demasiado por la parte superior de la parte posterior. La media o mediana es mejor si quiere reducirlo a un solo número.
Tenga en cuenta que MLE / top no está en 5 porque los datos se generaron aleatoriamente, no por estadísticas incorrectas.
Limitaciones
Este es un modelo simple que tiene varios defectos actualmente.
- No maneja la identidad de -90 y 90 grados. Sin embargo, esto se puede hacer haciendo una variable intermedia que cambie los valores extremos de los parámetros estimados al rango (-90, 90).
- X, Y y Z actualmente se modelan como independientes, aunque probablemente estén correlacionados y esto debe tenerse en cuenta para aprovechar al máximo los datos. Depende de si el dispositivo de medición se estaba moviendo (la correlación en serie y la distribución conjunta de X, Y y Z le darán mucha información) o si está parado (la independencia está bien). Puedo ampliar la respuesta para abordar esto, si así lo solicita.
Debo mencionar que hay mucha literatura sobre modelos espaciales bayesianos que no conozco.