Además de las excelentes respuestas ya publicadas, pensé que podría ser útil tener una visualización que explore las distribuciones de las proporciones observadas para variar norte y pags valores.
Para generar los siguientes histogramas, tomé norte muestras de un ensayo de Bernoulli con probabilidad pags, y repitió este proceso 10,000 veces. Luego generé un histograma de las proporciones observadas de cada uno de esos 10,000 experimentos.
Hablando visualmente, parece n p ≥ 5Es bastante razonable. Aunque cuandon = 50 parece que todavía hay algo de recorte con n p = 5.5 y n p = 6.5. Una vez que llegues an p = 7.5, el impacto parece bastante pequeño.
También tenga en cuenta que estas parcelas serían simétricas si tomamos nuevas pags′ valores de pags′= ( 1 - p ).
Código de Python para generar las parcelas. Puedes usar esto para ajustarnorte y pags si quieres experimentar tu mismo
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(20190915)
def make_hists(axs, n):
proportions = np.linspace(0.01, 0.19, len(axs))
for i, prop in enumerate(proportions):
# Draw n samples 10,000 times
x = np.random.rand(n, 10_000) < prop
means = x.mean(axis=0)
axs[i].hist(means, bins=np.linspace(0, 0.5, n//2))
axs[i].set_xlim([0, 0.5])
axs[i].set_yticklabels([])
ylim_mean = np.mean(axs[i].get_ylim())
axs[i].text(-0.08, ylim_mean * 3/2, f'$p={prop:.2f}$', va='center')
axs[i].text(-0.08, ylim_mean * 2/3, f'$np={n * prop:.1f}$', va='center')
axs[0].set_title(f'$n={n}$')
def main():
f, axs = plt.subplots(10, 2, sharex=True, figsize=(12, 8))
make_hists(axs[:, 0], 50)
make_hists(axs[:, 1], 250)
f.suptitle(
'Histograms of 10,000 sample proportions, varying $p$ and $n$',
fontsize=14
)
plt.show()
main()