Siempre me han enseñado que el CLT funciona cuando tiene muestras repetidas, y cada muestra es lo suficientemente grande. Por ejemplo, imagina que tengo un país de 1,000,000 de ciudadanos. Entiendo que CLT es que incluso si la distribución de sus alturas no era normal, si tomé 1000 muestras de 50 personas (es decir, realicé 1000 encuestas de 50 ciudadanos cada una), luego calculé su altura media para cada muestra, la distribución de estas muestras los medios serían normales.
Sin embargo, nunca he visto un caso del mundo real en el que los investigadores tomaron muestras repetidas. En cambio, toman una gran muestra (es decir, encuesta a 50,000 ciudadanos sobre su estatura) y trabajan a partir de eso.
¿Por qué los libros de estadística enseñan muestras repetidas y en el mundo real los investigadores solo realizan una sola muestra?
Editar: El caso del mundo real en el que estoy pensando es hacer estadísticas sobre un conjunto de datos de 50,000 usuarios de Twitter. Ese conjunto de datos obviamente no son muestras repetidas, es solo una gran muestra de 50,000.