¿Quién creó la primera tabla normal estándar?

Estoy a punto de presentar la tabla normal estándar en mi clase introductoria de estadísticas, y eso me hizo preguntarme: ¿quién creó la primera tabla normal estándar? ¿Cómo lo hicieron antes de que aparecieran las computadoras? Me estremezco al pensar en alguien con fuerza bruta que calcula mil sumas de Riemann a mano.

— Daniel Smolkin
fuente

Es bueno ver a alguien que quiere tener una enseñanza históricamente informada.

— mdewey

Respuestas:

Laplace fue el primero en reconocer la necesidad de tabulación, llegando a la aproximación:

\begin{aligned} G (x) & = \int_{x}^{\infty} e^{- t^{2}} d t \\ (1) & = \frac{1}{x} - \frac{1}{2 x^{3}} + \frac{1 \cdot 3}{4 x^{5}} - \frac{1 \cdot 3 \cdot 5}{8 x^{7}} + \frac{1 \cdot 3 \cdot 5 \cdot 7}{16 x^{9}} + \dots \end{aligned}

$\begin{align}G(x)&=\int_x^\infty e^{-t^2}dt\\[2ex]&=\small \frac1 x- \frac{1}{2x^3}+\frac{1\cdot3}{4x^5} -\frac{1\cdot 3\cdot5}{8x^7}+\frac{1\cdot 3\cdot 5\cdot 7}{16x^9}+\cdots\tag{1} \end{align}$

La primera tabla moderna de la distribución normal fue construida posteriormente por el astrónomo francés Christian Kramp en Analyze des Réfractions Astronomiques et Terrestres (Par le citoyen Kramp, Profesor de Chymie y de Physique expérimentale à l'école centrale du Département de la Roer, 1799) . De tablas relacionadas con la distribución normal: una breve historia Autor (es): Herbert A. David Fuente: The American Statistician, vol. 59, núm. 4 (noviembre de 2005), págs. 309-311 :

Ambiciosa, Kramp dio ocho decimal ( $8$ mesas D) hasta $x = 1.24,$ $9$ D a $1.50,$ $10$ D a $1.99,$ y $11$ D a $3.00$ , junto con las diferencias necesarias para la interpolación. Al escribir las primeras seis derivadas de $G(x),$ simplemente usa una expansión de la serie Taylor de $G(x + h)$ sobre $G(x),$ con $h = .01,$ hasta el término en $h^3.$ Esto le permite proceder paso a paso de $x = 0$ a $x = h, 2h, 3h,\dots,$ al multiplicar $h\,e^{-x^2}$ por
$1 - h x + \frac{1}{3} (2 x^{2} - 1) h^{2} - \frac{1}{6} (2 x^{3} - 3 x) h^{3} .$ $1-hx+ \frac 1 3 \left(2x^2 - 1\right)h^2 - \frac 1 6 \left(2x^3 - 3x\right)h^3.$ Por lo tanto, en $x = 0$ este producto se reduce a $.01 (1 - \frac{1}{3} \times .0001) = .00999967,$ $.01 \left(1 - \frac 1 3 \times .0001 \right) = .00999967,$ modo que en $G(.01) = .88622692 - .00999967 = .87622725.$

⋮

$\vdots$

Pero ... ¿qué tan preciso podría ser? Bien, tomemos $2.97$ como ejemplo:

¡Asombroso!

Pasemos a la expresión moderna (normalizada) del pdf gaussiano:

$\mathscr N(0,1)$

f_{X} (X = x) = \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}} = \frac{1}{\sqrt{2 π}} e^{- {(\frac{x}{\sqrt{2}})}^{2}} = \frac{1}{\sqrt{2 π}} e^{- {(z)}^{2}}

$f_X(X=x)=\large \frac{1}{\sqrt{2\pi}}\,e^{-\frac {x^2}{2}}= \frac{1}{\sqrt{2\pi}}\,e^{-\left(\frac {x}{\sqrt{2}}\right)^2}= \frac{1}{\sqrt{2\pi}}\,e^{-\left(z\right)^2}$

$z = \frac{x}{\sqrt{2}}$ $x = z \times \sqrt{2}$

$P_Z(Z>z=2.97)$ $e^{ax}$ $1/a$ $x$ $\sqrt{2}$

$\sqrt{2\pi}$

\frac{\sqrt{2 π}}{\sqrt{2}} P (X > x) = \sqrt{π} P (X > x)

$\frac{\sqrt{2\pi}}{\sqrt{2}}\,\mathbb P(X>x)=\sqrt{\pi}\,\,\mathbb P(X>x)$

$z=2.97$ $x=z\times \sqrt{2}=4.200214$

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05

¡Fantástico!

$0.06$

z = 0.06
(x = z * sqrt(2))

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988

$0.82629882$

Tan cerca...

La cosa es ... ¿qué tan cerca, exactamente? Después de todos los votos recibidos, no pude dejar la respuesta real pendiente. El problema era que todas las aplicaciones de reconocimiento óptico de caracteres (OCR) que probé estaban increíblemente apagadas, lo que no es sorprendente si has echado un vistazo al original. Entonces, aprendí a apreciar a Christian Kramp por la tenacidad de su trabajo mientras escribía personalmente cada dígito en la primera columna de su Table Première .

Después de una valiosa ayuda de @Glen_b, ahora puede ser muy precisa y está lista para copiar y pegar en la consola R en este enlace de GitHub .

Aquí hay un análisis de la precisión de sus cálculos. Prepárate...

Diferencia acumulativa absoluta entre los valores [R] y la aproximación de Kramp:

$0.000001200764$ $301$ $1$

Error absoluto medio (MAE) , omean(abs(difference))condifference = R - kramp:

$0.000000003989249$ $3$

En la entrada en la que sus cálculos eran más divergentes en comparación con [R], el primer valor decimal diferente estaba en la octava posición (centésima millonésima). En promedio (mediana) su primer "error" fue en el décimo dígito decimal (¡décimo billonésimo!). Y, aunque no estuvo totalmente de acuerdo con [R] en ningún caso, la entrada más cercana no diverge hasta la entrada digital trece.

Diferencia relativa media o mean(abs(R - kramp)) / mean(R)(igual que all.equal(R[,2], kramp[,2], tolerance = 0)):

$0.00000002380406$

Error cuadrático medio de raíz (RMSE) o desviación (da más peso a errores grandes), calculado comosqrt(mean(difference^2)):

$0.000000007283493$

Si encuentra una foto o retrato de Chistian Kramp, edite esta publicación y colóquela aquí.

— Antoni Parellada
fuente

Es bueno tener las dos referencias diferentes, y creo que los detalles adicionales (como la expansión explícita que Laplace dio para la cola superior) aquí son buenos.

— Glen_b

Esto es aún mejor con la última edición, pero no puedo votar dos veces, algo excelente. Tenga en cuenta que el artículo de David explica por qué la tabla de Kramp no tenía precisión en todos los dígitos mostrados (se realizó un error muy pequeño en el primer paso), pero aún es más que suficiente para la mayoría de las aplicaciones estadísticas

— Glen_b,

@ OlivierGrégoire Gracias por señalar mi dígito decimal mal escrito. Ahora está corregido. Crecí en una época en que el francés era imprescindible, y de ninguna manera significaba ninguna falta de respeto con mi uso peculiar del idioma (hay una referencia allí, pero no importa), que he revertido. En cuanto a "citoyen Kramp" - un intento de destacar formas históricas de introducción en el documento.

— Antoni Parellada

Oye, lo siento, sentiste que este era un comentario contundente. Solo estaba señalando cosas, de ninguna manera estoy diciendo que faltaste el respeto a nada. Puede jugar un juego de palabras o exagerar (o incluso hacer una referencia), por supuesto. Pero como chico de habla francesa, no entendí eso (al menos eso es lo que intenté transmitir). "Le citoyen Kramp" no tuvo problema: simplemente copié y puse comillas, porque no era inglés. Lo siento si sentiste que era un comentario contundente, no lo es. También falta mi uso del inglés. ^^ ¡Tu comparación fue bien hecha!

— Olivier Grégoire

@ P.Windridge Lo siento ... me di cuenta de que tenía un montón de hipervínculos rotos ...

— Antoni Parellada

Según HA David [1] Laplace reconoció la necesidad de tablas de distribución normal "ya en 1783" y Kramp produjo la primera tabla normal en 1799.

$0$ $x$ $e^{-t^2}$ $\frac{_1}{^2}$

Sin embargo, Kramp no usó estas series de Laplace, ya que había una brecha en los intervalos para que pudieran aplicarse de manera útil.

$x$ $G(x+h)$ $G$

Para ser específicos, citando el par de frases relevantes:

$G(x + h)$ $G(x)$ $h = .01$ $h^3$ $x = 0$ $x = h, 2h, 3h,...$ $he^{-x^2}$
$1 - h x + \frac{1}{3} (2 x^{2} - 1) h^{2} - \frac{1}{6} (2 x^{3} - 3 x) h^{3} .$ $1-hx+ \frac13(2x^2 - 1)h^2 - \frac16(2x^3 - 3x)h^3.$ $x = 0$ $.01 (1 - \frac{1}{3} \times .0001) = .00999967, (4)$ $.01 (1 - \frac13 \times .0001 ) = .00999967,\qquad\qquad (4)$ $G(.01) = .88622692 - .00999967 = .87622725$ $10^{-9}$

David indica que las tablas fueron ampliamente utilizadas.

Entonces, en lugar de miles de sumas de Riemann, fueron cientos de expansiones de Taylor.

En una nota más pequeña, en un apuro (atascado con solo una calculadora y algunos valores recordados de la tabla normal) he aplicado con bastante éxito la regla de Simpson (y las reglas relacionadas para la integración numérica) para obtener una buena aproximación a otros valores; no es todo lo que tedioso para producir una tabla * abreviado a algunas figuras de precisión. [Sin embargo, producir tablas de la escala y precisión de Kramp sería una tarea bastante grande, incluso utilizando un método más inteligente, como lo hizo.]

* Por una tabla abreviada, me refiero a una en la que básicamente puedes salirte con la interpolación entre valores tabulados sin perder demasiada precisión. Si sólo quiere decir que alrededor de 3 numérica de precisión que realmente no es necesario calcular todos los que muchos valores. He utilizado efectivamente la interpolación polinómica (más precisamente, técnicas de diferencia finita aplicadas), lo que permite una tabla con menos valores que la interpolación lineal, si es un poco más de esfuerzo en el paso de interpolación, y también he hecho la interpolación con una transformación logit, que hace que la interpolación lineal sea mucho más efectiva, pero solo es útil si tienes una buena calculadora).

[1] Herbert A. David (2005),
"Tablas relacionadas con la distribución normal: una breve historia"
The American Statistician , vol. 59, núm. 4 (noviembre), págs. 309-311

[2] Kramp (1799),
Analyze des Réfractions Astronomiques et Terrestres,
Leipzig: Schwikkert

— Glen_b
fuente

Cuestión interesante! Creo que la primera idea no surgió de la integración de fórmulas complejas; más bien, el resultado de aplicar los asintóticos en combinatoria. El método de lápiz y papel puede llevar varias semanas; No es tan difícil para Karl Gauss en comparación con el cálculo del pastel para sus predecesores. Creo que la idea de Gauss fue valiente; El cálculo fue fácil para él.

Ejemplo de crear una tabla z estándar desde cero-
1. Tome una población de n (digamos que n es 20) números y enumere todas las muestras posibles de tamaño r (digamos que r es 5) a partir de eso.
2. Calcule las medias muestrales. Obtiene medias de muestra nCr (aquí, 20c5 = 15504 medias).
3. Su media es la misma que la media de la población. Encuentre el estándar de medias de muestra.
4. Encuentre puntajes z de medias muestrales utilizando esas medias pop y stdev de medias muestrales.
5. Ordene z en orden ascendente y encuentre la probabilidad de que z esté en un rango en sus valores nCr z.
6. Comparar valores con tablas normales. Menor n es bueno para cálculos manuales. Mayor n producirá aproximaciones más cercanas de los valores normales de la tabla.

El siguiente código está en r:

n <- 20  
r <- 5  

p <- sample(1:40,n)  # Don't be misled!! Here, 'sample' is an r function  
                     used to produce n random numbers between 1 and 40.  
                     You can take any 20 numbers, possibly all different.  

c <- combn(p, r)     # all the nCr samples listed  
cmean <- array(0)  

for(i in 1:choose(n,r)) {  
    cmean[i] <- mean(c[,i])  
                }  

z <- array(0)  
for(i in 1:choose(n,r)) {  
    z[i] <- (cmean[i]-mean(c))/sd(cmean)  
                }  

ascend <- sort(z, decreasing = FALSE)

Probabilidad de que z caiga entre 0 y el valor positivo q a continuación; comparar con una tabla conocida. Manipule q a continuación entre 0 y 3.5 para comparar.

q <- 1  
probability <- (length(ascend[ascend<q])-length(ascend[ascend<0]))/choose(n,r)   
probability   # For example, if you use n=30 and r=5, then for q=1, you  
              will get probability is 0.3413; for q=2, prob is 0.4773

— Md Towhidul Islam
fuente

No veo cómo se puede usar el muestreo de esta manera para generar las tablas. Creo que el OP solo quería saber quién fue la primera persona

— Michael Chernick, el

Gracias por tu valioso comentario Michael Chernick. 1) El OP escribe "¿Cómo lo hicieron antes de que aparecieran las computadoras? Me estremezco al pensar en alguien que fuerza bruta computando mil sumas de Riemann a mano". Traté de responder esa parte. 2) El término 'muestra' no es muestra per se, es una función r para producir una lista de números aleatorios. También podemos tomar 20 números en su lugar. Vea el enlace r de apoyo aquí stackoverflow.com/questions/17773080/…

— Md Towhidul Islam