La respuesta corta:
Básicamente es más convincente tener 600 de 1000 que seis de 10 porque, dadas las mismas preferencias, es mucho más probable que ocurra 6 de 10 por casualidad.
Supongamos que la proporción que prefería las naranjas y las manzanas en realidad es igual (50% cada una). Llame a esto una hipótesis nula. Dadas estas probabilidades iguales, la probabilidad de los dos resultados son:
- Dada una muestra de 10 personas, hay un 38% de posibilidades de obtener aleatoriamente una muestra de 6 o más personas que prefieren las naranjas (lo cual no es tan improbable).
- Con una muestra de 1000 personas, hay menos de 1 en mil millones de posibilidades de que 600 o más de cada 1000 personas prefieran las naranjas.
(Por simplicidad, estoy asumiendo una población infinita de la cual extraer un número ilimitado de muestras).
Una simple derivación
Una forma de obtener este resultado es simplemente enumerar las posibles formas en que las personas pueden combinarse en nuestras muestras:
Para diez personas es fácil:
Considere tomar muestras de 10 personas al azar de una población infinita de personas con las mismas preferencias para las manzanas o las naranjas. Con las mismas preferencias, es fácil simplemente enumerar todas las combinaciones potenciales de 10 personas:
Aquí está la lista completa.
r C (n=10) p
10 1 0.09766%
9 10 0.97656%
8 45 4.39453%
7 120 11.71875%
6 210 20.50781%
5 252 24.60938%
4 210 20.50781%
3 120 11.71875%
2 45 4.39453%
1 10 0.97656%
0 1 0.09766%
1024 100%
r es el número de resultados (personas que prefieren las naranjas), C es el número de formas posibles de que muchas personas prefieran las naranjas, y p es la probabilidad discreta resultante de que muchas personas prefieran las naranjas en nuestra muestra.
(p es solo C dividido por el número total de combinaciones. Tenga en cuenta que hay 1024 formas de organizar estas dos preferencias en total (es decir, 2 a la potencia de 10).
- Por ejemplo, solo hay una forma (una muestra) para 10 personas (r = 10) para que todas prefieran las naranjas. Lo mismo es cierto para todas las personas que prefieren las manzanas (r = 0).
- Hay 10 combinaciones diferentes que dan como resultado nueve de ellas que prefieren las naranjas. (Una persona diferente prefiere manzanas en cada muestra).
- Hay 45 muestras (combinaciones) donde 2 personas prefieren manzanas, etc., etc.
(En general, hablamos de n C r combinaciones de resultados r de una muestra de n personas. Hay calculadoras en línea que puede usar para verificar estos números).
Esta lista nos permite darnos las probabilidades anteriores usando solo la división. Hay un 21% de posibilidades de obtener 6 personas en la muestra que prefieren las naranjas (210 de 1024 de las combinaciones). La posibilidad de obtener seis o más personas en nuestra muestra es del 38% (la suma de todas las muestras con seis o más personas, o 386 de 1024 combinaciones).
Gráficamente, las probabilidades se ven así:
Con números más grandes, el número de combinaciones potenciales crece rápidamente.
Para una muestra de solo 20 personas, hay 1,048,576 muestras posibles, todas con la misma probabilidad. (Nota: solo he mostrado cada segunda combinación a continuación).
r C (n=20) p
20 1 0.00010%
18 190 0.01812%
16 4,845 0.46206%
14 38,760 3.69644%
12 125,970 12.01344%
10 184,756 17.61971%
8 125,970 12.01344%
6 38,760 3.69644%
4 4,845 0.46206%
2 190 0.01812%
0 1 0.00010%
1,048,576 100%
Todavía hay una sola muestra donde las 20 personas prefieren las naranjas. Las combinaciones que presentan resultados mixtos son mucho más probables, simplemente porque hay muchas más formas en que las personas en las muestras se pueden combinar.
Las muestras sesgadas son mucho más improbables, solo porque hay menos combinaciones de personas que pueden dar lugar a esas muestras:
Con solo 20 personas en cada muestra, la probabilidad acumulada de tener 60% o más (12 o más) personas en nuestra muestra que prefieren naranjas se reduce a solo 25%.
Se puede ver que la distribución de probabilidad se vuelve más delgada y más alta:
Con 1000 personas, los números son enormes
Podemos extender los ejemplos anteriores a muestras más grandes (pero los números crecen demasiado rápido para que sea factible enumerar todas las combinaciones), en su lugar, he calculado las probabilidades en R:
r p (n=1000)
1000 9.332636e-302
900 5.958936e-162
800 6.175551e-86
700 5.065988e-38
600 4.633908e-11
500 0.02522502
400 4.633908e-11
300 5.065988e-38
200 6.175551e-86
100 5.958936e-162
0 9.332636e-302
La probabilidad acumulada de que 600 o más de cada 1000 personas prefieran las naranjas es solo 1.364232e-10.
La distribución de probabilidad ahora está mucho más concentrada alrededor del centro:
[
(Por ejemplo, para calcular la probabilidad de exactamente 600 de cada 1000 personas que prefieren las naranjas en el uso de R dbinom(600, 1000, prob=0.5)
que equivale a 4.633908e-11, y la probabilidad de 600 o más personas es 1-pbinom(599, 1000, prob=0.5)
, que equivale a 1.364232e-10 (menos de 1 en mil millones).