Si revisa las referencias a continuación, encontrará bastante variación en el fondo, aunque hay algunos elementos comunes.
Esos números se basan al menos en parte en algunos comentarios de Fisher, donde dijo
(mientras discute un nivel de 1/20)
Es conveniente tomar este punto como límite para juzgar si una desviación se considera significativa o no. Las desviaciones que exceden el doble de la desviación estándar se consideran formalmente significativas
Fisher, RA (1925) Métodos estadísticos para investigadores , p. 47
Por otro lado, a veces era más amplio:
Si uno de cada veinte no parece tener suficientes probabilidades, podemos, si lo preferimos, trazar la línea en uno de cada cincuenta (el punto del 2 por ciento), o uno de cada cien (el punto del 1 por ciento). Personalmente, el escritor prefiere establecer un bajo estándar de significancia en el punto del 5% e ignorar por completo todos los resultados que no alcanzan este nivel. Un hecho científico debe considerarse como establecido experimentalmente solo si un experimento diseñado adecuadamente rara vez falla en dar este nivel de importancia.
Fisher, RA (1926)
La disposición de los experimentos de campo . Revista del Ministerio de Agricultura, p. 504
Fisher también usó 5% para una de las tablas de su libro, pero la mayoría de sus otras tablas tenían una mayor variedad de niveles de significancia
Algunos de sus comentarios han sugerido enfoques más o menos estrictos (es decir, niveles alfa más bajos o más altos) en diferentes situaciones.
Ese tipo de discusión anterior condujo a una tendencia a producir tablas centradas en niveles de significancia de 5% y 1% (y a veces con otros, como 10%, 2% y 0.5%) por falta de cualquier otro valor 'estándar' para usar.
Sin embargo, en este documento , Cowles y Davis sugieren que el uso del 5%, o al menos algo similar, se remonta más allá del comentario de Fisher.
En resumen, nuestro uso del 5% (y en menor medida del 1%) es una convención bastante arbitraria, aunque claramente muchas personas parecen sentir que, por muchos problemas, están en el tipo correcto de estadio.
No hay ninguna razón para que un valor particular deba usarse en general.
Referencias adicionales:
Dallal, Gerard E. (2012). El pequeño manual de práctica estadística. -
¿Por qué 0.05?
Stigler, Stephen (diciembre de 2008). "Fisher y el nivel del 5%". Oportunidad 21 (4): 12.
disponible aquí
(Entre ellos, obtienes una buena cantidad de antecedentes; parece que entre ellos hay un buen caso para pensar que los niveles de importancia al menos en el estadio general de 5%, digamos entre 2% y 10%, habían sido más o menos en el aire por un rato)