Permítanme comenzar negando la premisa. Robert Geary probablemente no exageró el caso cuando dijo (en 1947) " ... la normalidad es un mito; nunca hubo, y nunca habrá, una distribución normal ".
La distribución normal es un modelo *, un aproximación que a veces es más o menos útil.
* (sobre el cual, vea George Box , aunque prefiero la versión en mi perfil).
Que algunos fenómenos sean aproximadamente normales puede no ser una gran sorpresa, ya que las sumas de efectos independientes [o incluso no muy fuertemente correlacionados] deberían, si hay muchos de ellos y ninguno tiene una variación sustancial en comparación con la variación de suma del resto que podríamos ver la distribución tiende a parecer más normal.
El teorema del límite central (que trata sobre la convergencia a una distribución normal de una media muestral estandarizada cuando llega al infinito en algunas condiciones suaves) al menos sugiere que podríamos ver una tendencia hacia esa normalidad con tamaños de muestra suficientemente grandes pero finitos.n
Por supuesto, si los medios estandarizados son aproximadamente normales, las sumas estandarizadas lo serán; Esta es la razón del razonamiento de la "suma de muchos efectos". Entonces, si hay muchas pequeñas contribuciones a la variación, y no están altamente correlacionadas, es probable que tengas que verla.
El teorema de Berry-Esseen nos da una declaración al respecto (convergencia hacia distribuciones normales) que realmente ocurre con medias de muestra estandarizadas para datos iid (en condiciones ligeramente más estrictas que para el CLT, ya que requiere que el tercer momento absoluto sea finito), como además de contarnos qué tan rápido sucede. Las versiones posteriores del teorema tratan con componentes no idénticamente distribuidos en la suma , aunque los límites superiores en la desviación de la normalidad son menos ajustados.
Menos formalmente, el comportamiento de las convoluciones con distribuciones razonablemente agradables nos da razones adicionales (aunque estrechamente relacionadas) para sospechar que en muchos casos puede ser una aproximación justa en muestras finitas. La convolución actúa como una especie de operador "difuminado" con el que las personas que usan la estimación de la densidad del núcleo en una variedad de núcleos estarán familiarizadas; una vez que estandariza el resultado (para que la varianza permanezca constante cada vez que realiza dicha operación), hay una clara progresión hacia formas de colina cada vez más simétricas a medida que suaviza repetidamente (y no importa mucho si cambia el núcleo cada vez).
Terry Tao da una buena discusión de las versiones del teorema del límite central y el teorema de Berry-Esseen aquí , y en el camino menciona un enfoque a una versión no independiente de Berry-Esseen.
Entonces, hay al menos una clase de situaciones en las que podríamos esperar verla, y razones formales para pensar que realmente tenderá a suceder en esas situaciones. Sin embargo, en el mejor de los casos, cualquier sensación de que el resultado de "sumas de muchos efectos" será normal es una aproximación. En muchos casos, es una aproximación bastante razonable (y en casos adicionales, aunque la aproximación de la distribución no es cercana, algunos procedimientos que suponen que la normalidad no son especialmente sensibles a la distribución de los valores individuales, al menos en muestras grandes).
Hay muchas otras circunstancias donde los efectos no "suman" y allí podemos esperar que sucedan otras cosas; por ejemplo, en muchos datos financieros, los efectos tienden a ser multiplicativos (los efectos moverán cantidades en términos porcentuales, como intereses e inflación y tasas de cambio, por ejemplo). Allí no esperamos normalidad, pero a veces podemos observar una aproximación aproximada a la normalidad en la escala logarítmica. En otras situaciones, ninguno puede ser apropiado, incluso en un sentido aproximado. Por ejemplo, los tiempos entre eventos generalmente no se aproximarán bien por la normalidad o la normalidad de los registros; no hay "sumas" ni "productos" de efectos para discutir aquí. Existen numerosos otros fenómenos en los que podemos argumentar a favor de un tipo particular de "ley" en circunstancias particulares.