Contexto
Un grupo de científicos sociales y estadísticos ( Benjamin et al., 2017 ) han sugerido recientemente que la tasa típica de falsos positivos ( = .05) utilizada como umbral para determinar la "significación estadística" debe ajustarse a un umbral más conservador. ( = .005). Un grupo competitivo de científicos sociales y estadísticos ( Lakens et al., 2018 ) han respondido, argumentando en contra del uso de este, o cualquier otro, umbral seleccionado arbitrariamente. La siguiente es una cita de Lakens et al. (p. 16) que ayuda a ejemplificar el tema de mi pregunta:α
Idealmente, el nivel alfa se determina comparando costos y beneficios con una función de utilidad utilizando la teoría de la decisión. Este análisis de costo-beneficio (y, por lo tanto, el nivel alfa) difiere al analizar grandes conjuntos de datos existentes en comparación con la recopilación de datos de muestras difíciles de obtener. La ciencia es diversa, y depende de los científicos justificar el nivel alfa que deciden usar. ... La investigación debe guiarse por principios de ciencia rigurosa, no por heurística y umbrales generales arbitrarios.
Pregunta
Me pregunto cómo se podría justificar un alfa elegido de una manera que esté "guiada por los principios de la ciencia rigurosa", como Lakens et al. ¿Sugerir, en la mayoría de los contextos de las ciencias sociales (es decir, fuera de casos seleccionados donde uno tiene una calidad más concreta, como la ganancia, para optimizar)?
Después de la difusión de Lakens et al., Comencé a ver que circulaban calculadoras en línea para ayudar a los investigadores a tomar esta decisión. Al usarlos, los investigadores necesitan especificar una "relación de costos" de errores falsos positivos y falsos negativos. Sin embargo, como esta calculadora aquí sugiere, determinando dicha relación un costo puede implicar una gran cantidad de conjeturas cuantitativa:
Si bien algunos costos de error son fáciles de cuantificar en términos monetarios (costos directos), otros son difíciles de asignar a una cantidad dolar (costos indirectos). ... A pesar de ser difícil de cuantificar, debe hacer un esfuerzo para ponerles un número.
Por ejemplo, aunque Lakens et al. sugiere estudiar muestras difíciles de alcanzar como un factor que uno podría considerar para justificar alfa, parece que todavía se tiene que adivinar cuán difícil es alcanzar esa muestra y, por lo tanto, cómo ajustar la selección de alfa en consecuencia. Como otro ejemplo, me parecería difícil cuantificar el costo de publicar un falso positivo, en términos de cuánto tiempo / dinero otros se comprometerían posteriormente a realizar una investigación basada en la inferencia errónea.
Si la determinación de esta relación de costos es en gran medida una cuestión de conjetura subjetiva, me pregunto si estas decisiones (alguna vez, además de optimizar algo como las ganancias) pueden "justificarse". Es decir, de una manera que existe fuera de las suposiciones hechas sobre muestreo, compensaciones, impacto, etc. De esta manera, determinar una relación de costos de errores falsos positivos / falsos negativos me parece, en mi opinión, algo parecido a seleccionar un previo en la inferencia bayesiana, una decisión que puede ser algo subjetiva, influir en los resultados y, por lo tanto, debatirse. -aunque no estoy seguro de que sea una comparación razonable.
Resumen
Para concretar mi consulta:
- ¿Pueden las tasas de falsos positivos / falsos negativos y sus relaciones de costos justificarse "rigurosamente" en la mayoría de los contextos de las ciencias sociales?
- Si es así, ¿cuáles son los principios generalizables que uno podría seguir para justificar estas elecciones analíticas (y tal vez un ejemplo o dos de ellas en acción)?
- Si no es así, ¿mi analogía de la subjetividad potencial en la elección de las relaciones de costos, como similar a la selección previa bayesiana, es razonable?
Referencias
Benjamin, DJ, Berger, J., Johannesson, M., Nosek, BA, Wagenmakers, E., ... Johnson, V. (2017, 22 de julio). Redefinir la significación estadística. Recuperado de psyarxiv.com/mky9j
Lakens, D., Adolfi, FG, Albers, CJ, Anvari, F., Apps, MA, ... Zwaan, RA (2018, 15 de enero). Justifica tu alfa. Recuperado de psyarxiv.com/9s3y6