Historia y origen
Según Robert D Cousins y Tommaso Dorigo , el origen del origen del umbral reside en el trabajo de física de partículas temprano de los años 60 cuando se investigaron numerosos histogramas de experimentos de dispersión y se buscaron picos / protuberancias eso podría indicar alguna partícula recién descubierta. El umbral es una regla aproximada para tener en cuenta las comparaciones múltiples que se están realizando.125σ
Ambos autores se refieren a un artículo de 1968 de Rosenfeld , que abordaba la cuestión de si existen o no mesones y bariones, para los cuales se midieron varios efectos . El artículo respondió negativamente a la pregunta argumentando que el número de reclamos publicados corresponde al número de fluctuaciones esperado estadísticamente. Junto con varios cálculos que respaldan este argumento, el artículo promovió el uso del nivel :34σ5σ
Rosenfeld: "Antes de continuar con el estudio de espectros de masas lejanos donde se han reportado golpes en
primero debemos decidir qué umbral de importancia para exigir en 1968. Quiero mostrarles que aunque los experimentadores probablemente deberían notar efectos , los teóricos y fenomenólogos harían mejor en esperar hasta que el efecto alcance ".(Kππ)3/2,(πρ)−−3σ>4σ
y más adelante en el documento (el énfasis es mío)
Rosenfeld: "Entonces, para repetir mi advertencia al comienzo de esta sección; estamos generando al menos 100 000 protuberancias potenciales por año, y deberíamos esperar varias fluctuaciones de y cientos de . ¿Cuáles son las implicaciones? Para el teórico o fenomenólogo, la moraleja es simple; espere efectos ".4σ3σ5σ
Tommaso parece ser cuidadoso al afirmar que comenzó con el artículo de Rosenfeld
Tommaso: "Sin embargo, debemos tener en cuenta que el artículo fue escrito en 1968, pero el criterio estricto de cinco desviaciones estándar para las afirmaciones de descubrimiento no se adoptó en los años setenta y ochenta. Por ejemplo, no se utilizó un criterio de cinco sigma por el descubrimiento de los bosones W y Z, que le valieron a Rubbia y Van der Meer el Premio Nobel de física en 1984. "
Pero en los años 80, el uso de se extendió. Por ejemplo, el astrónomo Steve Schneider menciona en 1989 que se está enseñando algo (enfatice el mío en la cita a continuación):5σ4
Schneider: "Con frecuencia, se citan 'niveles de confianza' del 95% o 99% para datos aparentemente discrepantes, pero esto equivale a solo dos o tres sigmas estadísticas. Me enseñaron a no creer nada menos que cinco sigma , lo que si usted piensa es un requisito absurdamente estricto, algo así como un nivel de confianza del 99.9999%. Pero, por supuesto, ese límite se usa porque el tamaño real de sigma casi nunca se conoce. Hay demasiadas variables libres en astronomía que podemos no controle o no sepa ".
Sin embargo, en el campo de la física de partículas, muchas publicaciones todavía se basaban en discrepancias de hasta finales de los 90. Esto solo cambió a a principios del siglo XXI. Probablemente se prescribe como una guía para publicaciones alrededor de 2003 (ver el prólogo en el libro de Franklin Shifting Standards )4σ5σ5
Franklin: en 2003, el criterio de 5 desviaciones estándar para la "observación de" parece haber estado en vigor
...
Un miembro de la colaboración de BaBar recuerda que, por esta época, los editores de Physical Review Letters emitieron el criterio de 5 sigma como una guía.
Uso moderno
Actualmente, el umbral es un estándar de libro de texto. Por ejemplo, aparece como un artículo estándar en physics.org o en algunos de los trabajos de Glen Cowan, como la sección de estadísticas de la Review of Particle Physics del grupo de datos de partículas (aunque con varias notas al margen críticas)5σ67
Glen Cowan: A menudo en HEP, el nivel de significación donde se dice que un efecto califica como descubrimiento esZ=5 , es decir, un efecto , que corresponde a un valor p de . Sin embargo, el grado real de creencia de que un nuevo proceso está presente dependerá en general de otros factores, como la plausibilidad de la hipótesis de la nueva señal y el grado en que puede describir los datos, la confianza en el modelo que condujo al valor p observado, y posibles correcciones para múltiples observaciones, de las cuales una se enfoca en el valor p más pequeño obtenido (el "efecto de buscar en otro lado").5σ2.87×10−7
El uso del nivel ahora se atribuye a 4 razones:5σ
La historia basada en la práctica encontró que es un buen umbral. (cosas exóticas parecen suceder al azar, incluso entre a , como recientemente el exceso de diphoton de 750 GeV )5σ3σ4σ
El efecto de buscar en otra parte (o las comparaciones múltiples ). Ya sea porque se prueban múltiples hipótesis o porque los experimentos se realizan muchas veces, las personas se ajustan a esto (más o menos) ajustando el límite a . Esto se relaciona con el argumento de la historia.5σ
Los efectos sistemáticos y la incertidumbre enσ menudo desconocen la incertidumbre del resultado del experimento. La se deriva, pero la derivación incluye suposiciones débiles, como la ausencia de efectos sistemáticos o la posibilidad de ignorarlos. Aumentar el umbral parece ser una forma de una especie de protección contra estos eventos. (Sin embargo, esto es un poco extraño. La calculada no tiene relación con el tamaño de los efectos sistemáticos y la lógica se rompe, un ejemplo es el "descubrimiento" de neutrinos superluminales que, según se informa, tiene un significado de ).σσ6σ
Las afirmaciones extraordinarias requieren evidencia extraordinaria Los resultados científicos se informan de manera frecuente, por ejemplo, utilizando intervalos de confianza o valores p. Pero, a menudo se interpretan de manera bayesiana. Seafirma que el niveltiene en cuenta esto.5σ
5σ8,912
Otros campos
Es interesante observar que muchos otros campos científicos no tienen umbrales similares o, de alguna manera, no abordan el problema. Me imagino que esto tiene un poco de sentido en el caso de experimentos con humanos en los que es muy costoso (o imposible) extender un experimento que dio una significación de .05 o .01.
1011
Primos, RD (2017). La paradoja de Jeffreys-Lindley y los criterios de descubrimiento en física de alta energía. Synthese, 194 (2), 395-432. enlace arxiv
Dorigo, T. (2013) Desmitificando el Criterio Five-Sigma, de science20.com 2019-03-07
Rosenfeld, AH (1968). ¿Hay mesones o bariones lejanos? fuente web: beca
Burbidge, G., Roberts, M., Schneider, S., Sharp, N. y Tifft, W. (1990, noviembre). Panel de discusión: problemas relacionados con Redshift. En la publicación de la Conferencia de la NASA (Vol. 3098, p. 462). enlace a fotocopia en harvard.edu
Franklin, A. (2013). Estándares cambiantes: experimentos en física de partículas en el siglo XX. Prensa de la Universidad de Pittsburgh.
¿Qué significa el 5 sigma? de physics.org 2019-03-07
Beringer, J., Arguin, JF, Barnett, RM, Copic, K., Dahl, O., Groom, DE, ... & Yao, WM (2012). Revisión de la física de partículas. Revisión física de partículas D, campos, gravitación y cosmología, 86 (1), 010001. (sección 36.2.2. Pruebas de significación, página 394, enlace aps.org )
Lyons, L. (2013). Descubriendo el significado de 5 sigma. preimpresión arXiv arXiv: 1310.1284. enlace arxiv
Lyons, L. (2014). Cuestiones estadísticas en búsquedas de nueva física. arXiv preprint enlace arxiv
Baker, M. (2015). Más de la mitad de los estudios de psicología fallan en la prueba de reproducibilidad. Noticias de la naturaleza. de nature.com 2019-03-07
Horton, R. (2015). Fuera de línea: ¿cuál es la medicina 5 sigma? The Lancet, 385 (9976), 1380. de thelancet.com 2019-03-07