Tengo una variable aleatoria que toma valores en los enteros no negativos , llama a las probabilidades para cada resultado . Puedo tomar muestras de la distribución de independiente y económica; Actualmente tengo un tamaño de muestra de . Parece que , con una disminución aproximadamente exponencial.
Tengo una secuencia de formas cuadráticas con coeficientes positivos:
- ...
- ...
Lo que me gustaría tener es un intervalo de confianza para las que tenga menos de ancho, pero tomaré lo que pueda conseguir.
Tengo límites rigurosos en , y dado que los coeficientes de las son todos positivos, es sencillo convertirlos en límites rigurosos para las 's. Pero no sé cómo hacer esto correctamente con intervalos de confianza.
¿De qué se trata esto? Encontré un fenómeno extraño en la teoría de números, y sé cómo demostrar que realmente sucede, pero hacerlo requerirá un esfuerzo de programación de mi parte y una cantidad considerable de tiempo en nuestro clúster local. Antes de invertir ese tiempo y obstruir nuestra máquina, me gustaría estar más seguro de que el fenómeno es real.
Quiero cuantificar la razonabilidad de mi afirmación de que y . Mis estimaciones indican que es de alrededor de , razón por la cual quería CI en esa resolución.
Fije un número entero grande , y deje que sea un subconjunto elegido uniformemente de (es decir, cada subconjunto particular tiene una probabilidad de ser elegido). Sea la probabilidad de que exactamente de los números de no puedan escribirse como la suma de dos elementos de ; deje . Es un poco difícil de probar, pero existen esos límites y . Ahora no sorprende que sea pequeño, y a medida que aumentaaumenta, tiene un pico y luego decae exponencialmente. La parte extraña es que hay un sesgo contra 7. Es decir, experimentalmente y . Es decir, lo que no fue una sorpresa en realidad no es cierto: la distribución es bimodal.
Puedo expresar las '(usando alguna teoría) como arriba sin el límite en términos de esta otra distribución, definida por las ' s. Eso es útil porque tengo una manera de vincular rigurosamente los usando, como mencioné anteriormente, algunos cálculos grandes. Además, tengo un conjunto de datos muy grande para la variable