Puede encontrar este documento útil (o al menos interesante):
http://www.umass.edu/remp/Papers/Smith&Wells_NERA06.pdf
Los investigadores de UMass en realidad llevaron a cabo un estudio similar a lo que estás preguntando. ¿A qué tamaño de muestra siguen ciertos datos distribuidos una distribución normal debido a CLT? Aparentemente, una gran cantidad de datos recopilados para los experimentos de psicología no se distribuyen de manera normal, por lo que la disciplina depende en gran medida del CLT para hacer alguna inferencia en sus estadísticas.
Primero, realizaron pruebas con datos uniformes, bimodales y una distribución normal. Usando Kolmogorov-Smirnov, los investigadores probaron cuántas de las distribuciones fueron rechazadas por normalidad en elα = 0.05 nivel.
Table 2. Percentage of replications that departed normality based on the KS-test.
Sample Size
5 10 15 20 25 30
Normal 100 95 70 65 60 35
Uniform 100 100 100 100 100 95
Bimodal 100 100 100 75 85 50
Por extraño que parezca, el 65 por ciento de los datos distribuidos normalmente fueron rechazados con un tamaño de muestra de 20, e incluso con un tamaño de muestra de 30, el 35% todavía fueron rechazados.
Luego probaron varias distribuciones muy sesgadas creadas utilizando el método de poder de Fleishman:
Y= a X+ b X2+ c X3+ dX4 4
X representa el valor extraído de la distribución normal, mientras que a, b, cyd son constantes (tenga en cuenta que a = -c).
Corrieron las pruebas con tamaños de muestra de hasta 300
Skew Kurt A B C D
1.75 3.75 -0.399 0.930 0.399 -0.036
1.50 3.75 -0.221 0.866 0.221 0.027
1.25 3.75 -0.161 0.819 0.161 0.049
1.00 3.75 -0.119 0.789 0.119 0.062
Encontraron que en los niveles más altos de sesgo y kurt (1.75 y 3.75) que los tamaños de muestra de 300 no producían medias de muestra que siguieran una distribución normal.
Desafortunadamente, no creo que esto sea exactamente lo que estás buscando, pero me topé con él y lo encontré interesante, y pensé que tú también.