Esta pregunta se deriva de esta sobre la "Regla .632". Estoy escribiendo con referencia particular a la respuesta / notación de user603 en la medida en que simplifica las cosas.
Esa respuesta comienza con una muestra de tamaño con sustitución, de n elementos distintos en la colección (llamada) que N. La probabilidad de que la i t h muestra es i es diferente de un elemento en particular m de N es entonces ( 1 - 1 / n ) .
En esa respuesta, todos los elementos de N tienen la misma probabilidad de ser dibujados al azar.
Mi pregunta es la siguiente: supongamos, en cambio, que en la pregunta anterior, los elementos a dibujar son tales que normalmente se distribuyen. Es decir, subdividimos la curva normal estándar de a en (digamos) 100 subintervalos de igual longitud. Cada uno de los 100 elementos en N tiene una probabilidad de ser dibujada que es igual al área subtendida por la curva en su intervalo respectivo.
Mi pensamiento fue el siguiente:
El razonamiento es similar al de la respuesta vinculada, creo. La probabilidad de que , con un elemento de N, es en la que es la probabilidad de sacar
La probabilidad de que un elemento particular m esté en la muestra S de tamaño n es
= 1 - n ∏ 1 ( 1 - F i ) .
Un cálculo parece mostrar que a medida que la longitud de los subintervalos se reduce, la respuesta converge al mismo número que en el primer caso (las probabilidades de todas iguales).
Esto parece contradictorio (para mí) porque la construcción parece incluir elementos de N que son raros, por lo que esperaría un número menor que .632.
Además, si esto es correcto, supongo que tendríamos
que todavía no sé si es verdadero o falso.
Editar: si es cierto, probablemente generalizaría algunos.
Gracias por cualquier idea.