Soy bastante nuevo en estadísticas (un puñado de cursos Uni de nivel principiante) y me preguntaba sobre el muestreo de distribuciones desconocidas. Específicamente, si no tiene idea de la distribución subyacente, ¿hay alguna forma de "garantizar" que obtenga una muestra representativa?
Ejemplo para ilustrar: digamos que está tratando de descubrir la distribución global de la riqueza. Para cualquier individuo, de alguna manera puede averiguar su riqueza exacta; pero no puedes "probar" a cada persona en la Tierra. Entonces, digamos que muestreas n = 1000 personas al azar.
Si su muestra no incluye Bill Gates, podría pensar que no existen multimillonarios.
Si la muestra incluye Bill Gates, podría pensar que los multimillonarios son más comunes de lo que realmente son.
En cualquier caso, no se puede saber cuán comunes o raros son los multimillonarios; Es posible que ni siquiera pueda decir si existe alguna.
¿Existe un mejor mecanismo de muestreo para un caso como este?
¿Cómo le diría a priori qué procedimiento de muestreo utilizar (y cuántas muestras se necesitan)?
Me parece que es posible que tenga que "probar" un gran porcentaje de la población para saber, con algo que se acerque a una certeza razonable, qué tan comunes o raros son los multimillonarios en el planeta, y que esto se debe a que la distribución subyacente es un poco difícil trabajar con.