Cuando enseñe estadística, use "normal" o "gaussiano"?


42

Utilizo principalmente "distribución gaussiana" en mi libro, pero alguien acaba de sugerirme que cambie a "distribución normal". ¿Algún consenso sobre qué término usar para principiantes?

Por supuesto, los dos términos son sinónimos , por lo que no se trata de una sustancia, sino de qué término se usa más comúnmente. Y, por supuesto, uso ambos términos. Pero, ¿cuál debería usarse principalmente?


1
¿Hay alguna sección de vista previa / capítulo de muestra de su libro disponible en alguna parte? Escucho cosas buenas al respecto.
Glen_b

2
@Glen_b La función "Ver dentro" de amazon.com le permite previsualizar el libro. Además, hay tres capítulos disponibles aquí: intuitivobiostatistics.com/excerpts
Harvey Motulsky

66
La cuestión de "qué término se usa más comúnmente" se puede abordar fácilmente, aunque de manera cruda: una búsqueda en Google de la distribución "gaussiana" tiene aproximadamente 2/3 de los resultados de una búsqueda de "distribución normal". La proporción es un poco diferente en Google Scholar, donde ahora la "distribución gaussiana" tiene la mitad de los éxitos de la "distribución normal" (pero solo un cuarto cuando se excluye "inversa"). Estos resultados sugieren que (1) "normal" es más popular pero (2) "gaussiano" es ampliamente reconocido. Mirar los resultados sugiere que las frases como "asintóticamente normal" pueden tardar mucho tiempo en reemplazarse, si es que alguna vez lo hacen.
whuber

2
En la extensión de @whuber, creo que también hay una diferencia entre los campos: "Gauss" parece relativamente más predominante en la ciencia, mientras que el "normal" parece ser el normal de término en las ciencias sociales ...
abaumann

1
Prueba "anormal": P
Mehrdad

Respuestas:


47

Aunque tiendo a decir "normal" con más frecuencia (ya que eso es lo que me enseñaron cuando aprendí por primera vez), creo que "gaussiano" es una mejor opción, siempre y cuando los estudiantes / lectores estén bastante familiarizados con ambos términos:

  • Lo normal no es particularmente típico, por lo que el nombre en sí mismo es engañoso. Ciertamente juega un papel importante (no menos debido a la CLT), pero los datos observados son mucho menos frecuentes, particularmente cerca de Gauss, de lo que a veces se sugiere.

  • La palabra (y palabras asociadas como "normalizar") tiene varios significados que pueden ser relevantes en estadística (considere "base ortonormal" por ejemplo). Si alguien dice "Normalicé mi muestra", no puedo decir con certeza si se transformaron a la normalidad, calcularon z-score, escalaron el vector a la longitud de la unidad, a la longitud , o una serie de otras posibilidades. Si tendíamos a llamar a la distribución "Gaussiana", al menos se elimina la primera opción y algo más descriptivo la reemplaza.n

  • Gauss al menos tiene un grado razonable de reclamo de la distribución.


3
+1 para el bit "siempre y cuando los estudiantes / lectores estén bastante familiarizados con ambos términos". Creo que sería un mal servicio para los estudiantes enseñar solo "gaussiano", simplemente porque "normal" está muy extendido.
Patrick Coulombe

66
Estoy de acuerdo en que tenemos que enseñar a ambos. Si comenzáramos desde cero, y supiéramos lo que sabemos ahora, nunca permitiríamos que emerja "normal", porque (1) el término está sobrecargado de alguna manera (2) lo normal (gaussiano) no es normal (habitual o esperado) de datos. "Gaussian" es la alternativa más común, a pesar de que hay una historia anterior a Gauss. ET Jaynes sugirió "central", que es una idea divertida, pero no ha tenido éxito. (Reconozco los argumentos que se basan en el teorema del límite central.)
Nick Cox

Con respecto a la viñeta n. ° 2, cuando se trata de la ciencia y las matemáticas en general, no está necesariamente claro si " normal " o " Gauss " es más común. ;-)
cardenal

@cardinal: estoy bastante de acuerdo con la sugerencia de que tiende a inclinarse mucho más hacia lo "gaussiano" en esas áreas, y también agregaría ingeniería.
Glen_b

1
@Glen_b: De acuerdo. (En mi modelo mental, incluyo la ingeniería bajo el paraguas general de la ciencia, aunque eso es, tal vez, algo fuera de lo normal, ejem.) :-)
cardenal

36

Yo usaría gaussiano.

Un problema que enfrentan las personas que aprenden estadísticas es que usamos palabras inglesas cotidianas para significar cosas diferentes (poder, importancia, distribución, etc.). En la medida en que podamos minimizar esto, deberíamos. "Normal" ya tiene muchos significados.


2
Peter: estoy de acuerdo. Por eso siempre he usado "gaussiano". Pero un comentario de un revisor sobre la nueva edición (concisa), empujó fuertemente "normal".
Harvey Motulsky

25

Un argumento a favor de lo normal es la notación arraigada para la distribución, en la que significa "normal". No he visto a nadie proponer cambiar esto a .N(μ,σ2)NG(μ,σ2)


1
GProbablemente, entraría en conflicto con Gamma, que debería denominarse pero desafortunadamente eso se debe a la función del mismo nombre. Una alternativa podría ser o , que también sería coherente con y la abreviatura frecuente de a . Pero en realidad me gusta la notación , porque la escribo constantemente y es una letra fácil de garabatear. ΓGaussGaussianBernoullibinomialbinomN
shadowtalker

Ese es un punto justo, aunque si se presentan ambos términos, el uso de se puede introducir entonces. N
Glen_b

8
Let ;-)GN(μ,σ2)
Stéphane Laurent

1
@ StéphaneLaurent: Creo que mi punto es que si evita la palabra "normal", los estudiantes pueden tener dificultades para recordar lo que significa , ya que ya no sería nemotécnico. N(μ,σ2)
Nate Eldredge

10

En alemán a menudo se llama Gaußsche Normalverteilung, por lo que es casi imposible entrar en conflicto fácilmente.

¿Sería apropiado para usted combinar gaussiano y normal ?


8
¡Quizás gnormalfuncione en inglés!
Dilip Sarwate

2
@DilipSarwate 𝅘𝅥𝅮 Soy un gnormal, otro gnormal 𝅘𝅥𝅮 (disculpas a los mensajeros. Flanders y Swann)
hobbs

9

De acuerdo con la enciclopedia Wolfram :

Mientras que los estadísticos y matemáticos usan uniformemente el término "distribución normal" para esta distribución, los físicos a veces lo llaman una distribución gaussiana y, debido a su forma curva y acampanada, los científicos sociales se refieren a ella como la "curva de campana".

Estoy de acuerdo en que "normal" es más fácil de confundir, pero sospecho que los libros de estadísticas usualmente usan "normal".


+1 para una respuesta descriptiva en lugar de prescriptiva. De hecho, estoy de acuerdo con las otras respuestas de que Gaussian es preferible, sin importar qué campo, pero es informativo comenzar desde el contexto de lo que está muy extendido en el uso existente.
R ..

En cuanto a la frase "curva de campana", la evitaría por completo en cualquier entorno de enseñanza. Tiene connotaciones altamente racistas como resultado del infame libro del mismo nombre, y cualquiera de sus estudiantes que lo sepa es probable que se distraiga y asocie lo que esté diciendo con teorías sin sentido sobre la superioridad racial en lugar de tener el sujeto se sostiene solo.
R ..

@R .. Descriptivo, sí, pero esa descripción está directamente contradecida por las respuestas aquí, que indican que una fracción significativa de estadísticos y matemáticos en realidad usan el término "gaussiano".
David Richerby

Otra razón para no usar el término "curva de campana" para denotar la (función de densidad de) la distribución gaussiana / normal es que hay muchas distribuciones cuya función de densidad de probabilidad (pdf) se asemeja a una curva de campana. ¡Incluso el pdf de una distribución de Cauchy parece una curva de campana!
Mico

+1 para explicar términos relativos en diferentes disciplinas. ¡Gracias!
Entusiasta

7

Me gustaría señalar que S. Stigler utiliza la distribución Normal / Gauss / Laplace-Gauss para probar la 'Ley de la epónimos de Stigler' publicada en Estadísticas sobre la mesa (algunas páginas están disponibles en books.google ).

Particularmente interesante y relevante para estas preguntas es que en las páginas 287-288 hay tablas del uso histórico de 'Normal' vs 'Gauss' vs 'Laplace' y parece que a lo largo de los años el uso cambió de 2:15 a favor de normal en 1816-1884 a 8:14 (1888-1917) a 5:17 (1919-1939) a 9:10 (1947-1976).

De acuerdo con esto, el uso de 'normal' vs 'Gauss' se está volviendo más igualitario. O si cree que la tendencia continuará, entonces 'Gauss' vencerá a 'normal' en 50-100 años.


5

Una respuesta que aún no he visto entre todas las buenas respuestas:

Principalmente uso "normal" por razones de familiaridad previa, pero me gusta ponerlo en mayúscula para enfatizar su significado técnico: "... si los datos se distribuyen normalmente ..." (no sé si copié esta práctica de en otro lugar o (re) lo inventé yo mismo)


5

Cuál usar depende del nivel de estadísticas que se enseña. Desafortunadamente, mi experiencia docente indica que la mayoría de los estudiantes de pregrado nunca captan completamente el concepto de distribución de probabilidad. Sin embargo, todos de alguna manera deben familiarizarse con el CLT y las formas de pensar sobre la incertidumbre. Para una clase de pregrado, Normal es preferible porque no agrega la ansiedad de una nueva palabra desconocida. Para los estudiantes de posgrado, se prefiere el gaussiano debido a toda la confusión antes mencionada sobre la normalización y el contexto histórico que proporciona. Enseño una clase de investigación de pregrado que requiere dos clases de estadísticas de prerrequisitos y todos los libros de pregrado que he visto utilizados en los últimos 30 años han usado Normal.


1
"la mayoría de los estudiantes de pregrado nunca comprenden completamente el concepto de una distribución de probabilidad" +1
Code-Guru

4

El nombre normalproviene de algunas de las observaciones de que los errores se comportan normalmente. Encontrarás más detalles aquí . Si esa es la razón para llamar a esta distribución una distribución normal, puede crear una nueva confusión como lo es la distribución normal para el recuento de accidentes poisson. Creo que deberíamos avanzar y comenzar a llamarlo en su Gaussianlugar.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.