Parece suponer en su pregunta que el concepto de la distribución normal existía antes de que se identificara la distribución, y las personas trataron de descubrir cuál era. No me queda claro cómo funcionaría eso. [Editar: hay al menos un sentido que podríamos considerar como una "búsqueda de una distribución", pero no es "una búsqueda de una distribución que describe muchos y muchos fenómenos"]
Este no es el caso; la distribución se conocía antes de que se llamara distribución normal.
¿Cómo le demostraría a esa persona que la función de densidad de probabilidad de todos los datos distribuidos normalmente tiene forma de campana?
La función de distribución normal es lo que generalmente se llama "forma de campana": todas las distribuciones normales tienen la misma "forma" (en el sentido de que solo difieren en escala y ubicación).
Los datos pueden verse más o menos "en forma de campana" en la distribución, pero eso no lo hace normal. Muchas distribuciones no normales se ven similarmente "en forma de campana".
Las distribuciones de población reales de las que se obtienen los datos probablemente nunca sean realmente normales, aunque a veces es una aproximación bastante razonable.
Esto suele ser cierto para casi todas las distribuciones que aplicamos a las cosas en el mundo real: son modelos , no hechos sobre el mundo. [Como ejemplo, si hacemos ciertas suposiciones (las de un proceso de Poisson), podemos derivar la distribución de Poisson, una distribución ampliamente utilizada. Pero, ¿se cumplen exactamente esos supuestos ? En general, lo mejor que podemos decir (en las situaciones correctas) es que son casi verdaderas.]
¿Qué consideramos realmente los datos distribuidos normalmente? ¿Datos que siguen el patrón de probabilidad de una distribución normal u otra cosa?
Sí, para estar realmente distribuido normalmente, la población de la que se extrajo la muestra tendría que tener una distribución que tenga la forma funcional exacta de una distribución normal. Como resultado, cualquier población finita no puede ser normal. Las variables que necesariamente delimitan no pueden ser normales (por ejemplo, los tiempos que se toman para tareas particulares, la duración de cosas particulares no pueden ser negativas, por lo que en realidad no se pueden distribuir normalmente).
quizás sería más intuitivo que la función de probabilidad de los datos distribuidos normalmente tiene la forma de un triángulo isósceles
No veo por qué esto es necesariamente más intuitivo. Ciertamente es más simple.
Al desarrollar por primera vez modelos para distribuciones de errores (específicamente para astronomía en el período inicial), los matemáticos consideraron una variedad de formas en relación con las distribuciones de errores (incluida en un punto inicial una distribución triangular), pero en gran parte de este trabajo fueron las matemáticas (más bien que la intuición) que se utilizó. Laplace observó distribuciones dobles exponenciales y normales (entre otras), por ejemplo. De manera similar, Gauss usó las matemáticas para derivarlas aproximadamente al mismo tiempo, pero en relación con un conjunto diferente de consideraciones que Laplace.
En el sentido estricto de que Laplace y Gauss estaban considerando "distribuciones de errores", podríamos considerar que se trata de una "búsqueda de una distribución", al menos por un tiempo. Ambos postularon algunas propiedades para una distribución de errores que consideraron importantes (Laplace consideró una secuencia de criterios algo diferentes a lo largo del tiempo) condujeron a diferentes distribuciones.
Básicamente, mi pregunta es ¿por qué la función de densidad de probabilidad de distribución normal tiene forma de campana y no otra?
La forma funcional de lo que se llama función de densidad normal le da esa forma. Considere el estándar normal (por simplicidad; cualquier otro normal tiene la misma forma, que difiere solo en escala y ubicación):
fZ(z)=k⋅e−12z2;−∞<z<∞
k
x
Si bien algunas personas han considerado que la distribución normal de alguna manera es "usual", en realidad solo en situaciones particulares se tiende a verla como una aproximación.
El descubrimiento de la distribución generalmente se atribuye a de Moivre (como una aproximación al binomio). De hecho, derivó la forma funcional al tratar de aproximar los coeficientes binomiales (/ probabilidades binomiales) para aproximar los cálculos tediosos, pero, aunque deduce efectivamente la forma de la distribución normal, no parece haber pensado en su aproximación como un distribución de probabilidad, aunque algunos autores sugieren que lo hizo. Se requiere una cierta cantidad de interpretación para que haya margen para las diferencias en esa interpretación.
Gauss y Laplace trabajaron en ello a principios de 1800; Gauss escribió sobre esto en 1809 (en relación con que es la distribución para la cual la media es el MLE del centro) y Laplace en 1810, como una aproximación a la distribución de sumas de variables aleatorias simétricas. Una década después, Laplace ofrece una forma temprana de teorema del límite central, para variables discretas y continuas.
Los primeros nombres para la distribución incluyen la ley del error , la ley de la frecuencia de los errores , y también lleva el nombre de Laplace y Gauss, a veces conjuntamente.
El término "normal" se usó para describir la distribución de forma independiente por tres autores diferentes en la década de 1870 (Peirce, Lexis y Galton), el primero en 1873 y los otros dos en 1877. Esto es más de sesenta años después del trabajo de Gauss y Laplace y más del doble que desde la aproximación de De Moivre. El uso de Galton fue probablemente más influyente, pero usó el término "normal" en relación con él solo una vez en ese trabajo de 1877 (en su mayoría lo llamó "la ley de la desviación").
Sin embargo, en la década de 1880 Galton usó el adjetivo "normal" en relación con la distribución en numerosas ocasiones (por ejemplo, como la "curva normal" en 1889), y a su vez tuvo mucha influencia en los estadísticos posteriores en el Reino Unido (especialmente Karl Pearson ) No dijo por qué usó el término "normal" de esta manera, pero presumiblemente lo dijo en el sentido de "típico" o "usual".
El primer uso explícito de la frase "distribución normal" parece ser de Karl Pearson; ciertamente lo usa en 1894, aunque afirma haberlo usado mucho antes (un reclamo que vería con cierta precaución).
Referencias
Miller, Jeff
"Usos más antiguos conocidos de algunas de las palabras de las matemáticas:"
Distribución normal (entrada de John Aldrich)
http://jeff560.tripod.com/n.html
Stahl, Saul (2006),
"La evolución de la distribución normal",
Mathematics Magazine , vol. 79, N ° 2 (abril), pp 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
Distribución normal, (2016, 1 de agosto).
En Wikipedia, la enciclopedia libre.
Consultado el 12 de agosto de 2016 a las 12:02 en
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History
Hald, A (2007),
"La aproximación normal de De Moivre al binomio, 1733, y su generalización",
en: Una historia de inferencia estadística paramétrica de Bernoulli a Fisher, 1713–1935; pp 17-24
[Puede observar discrepancias sustanciales entre estas fuentes en relación con su cuenta de de Moivre]