Tengo procesos normalmente distribuidos de los cuales obtengo pequeñas muestras ( n típicamente 10-30) que quiero usar para estimar la varianza. Pero con frecuencia las muestras están tan juntas que no podemos medir puntos individuales cerca del centro.
Tengo esta vaga comprensión de que deberíamos ser capaces de construir un estimador eficiente utilizando muestras ordenadas: por ejemplo, si sé que la muestra contiene 20 puntos, y que 10 están agrupados muy cerca del centro demasiado apretados para medirlos individualmente, pero tengo mediciones discretas de 5 en cada cola, ¿existe un enfoque estándar / fórmula para estimar la varianza del proceso que hace un uso óptimo de tales muestras?
(Tenga en cuenta que no creo que pueda simplemente ponderar el promedio del centro. Por ejemplo, es posible que 7 muestras se agrupen firmemente mientras que otras tres están asimétricamente asimétricas a un lado, pero lo suficientemente cerca no podemos decir eso sin un muestreo único más tedioso .)
Si la respuesta es complicada, agradecería cualquier consejo sobre lo que debería estar investigando. Por ejemplo, ¿es este un problema de estadística de orden? ¿Es probable que haya una respuesta formulada o es un problema computacional?
Detalle actualizado: La aplicación es análisis de objetivos de tiro. Una sola muestra subyacente es el punto de impacto ( x, y ) de un solo disparo en el objetivo. El proceso subyacente tiene una distribución normal bivariada simétrica pero no hay correlación entre los ejes, por lo que podemos tratar las muestras { x } e { y } como extracciones independientes de la misma distribución normal. (También podríamos decir que el proceso subyacente está distribuido por Rayleigh, pero no podemos medir las variaciones de muestra de Rayleigh porque no podemos estar seguros de las coordenadas del centro "verdadero" del proceso, que para n pequeña puede ser significativamente distante del centro de muestra ( , ).)
Se nos da un objetivo y la cantidad de disparos que se le disparan. El problema es que para n >> 3 pistolas precisas típicamente dispararán un "agujero irregular" rodeado de disparos distintos. Podemos observar el ancho x e y del hoyo, pero no sabemos en qué parte del hoyo impactaron los disparos no distintos.
Aquí hay algunos ejemplos de objetivos más problemáticos:
(De acuerdo, en un mundo ideal, cambiaríamos / cambiaríamos objetivos después de cada disparo y luego agregaríamos las muestras para su análisis. Hay una serie de razones que a menudo no son prácticas, aunque se hace cuando es posible ).
Notas adicionales después de las aclaraciones de WHuber en los comentarios: Los disparos producen agujeros objetivo que son de diámetro uniforme y conocido. Cuando un disparo está fuera de cualquier "grupo irregular", conocemos el radio del proyectil y podemos medir el centro preciso . En cada "grupo irregular" podemos discernir un cierto número de "bolas" periféricas y nuevamente marcar el centro preciso de esos disparos externos en función del radio de proyectil conocido. Son los disparos restantes "censurados por el centro" que solo sabemos impactados en algún lugar en el interior de un "grupo irregular" (que normalmente es, y si es necesario, supongamos, uno por objetivo).
Para facilitar la solución, creo que será más fácil reducir esto a un conjunto de muestras unidimensionales de lo normal, con un intervalo central de ancho w > d , donde d es el diámetro del proyectil, que contiene c < n muestras "censuradas".