He estado leyendo sobre valores , tasas de error tipo 1, niveles de significancia, cálculos de potencia, tamaños de efectos y el debate de Fisher vs Neyman-Pearson. Esto me ha dejado un poco abrumado. Pido disculpas por el muro de texto, pero sentí que era necesario proporcionar una visión general de mi comprensión actual de estos conceptos, antes de pasar a mis preguntas reales.
Por lo que he reunido, un valor es simplemente una medida de sorpresa, la probabilidad de obtener un resultado al menos igual de extrema, dado que la hipótesis nula es cierta. Originalmente, Fisher pretendía que fuera una medida continua.
En el marco de Neyman-Pearson, selecciona de antemano un nivel de significación y lo utiliza como punto de corte (arbitrario). El nivel de significancia es igual a la tasa de error tipo 1. Se define por la frecuencia a largo plazo, es decir, si repitiera un experimento 1000 veces y la hipótesis nula es cierta, aproximadamente 50 de esos experimentos tendrían un efecto significativo , debido a la variabilidad del muestreo. Al elegir un nivel de significancia, nos estamos protegiendo de estos falsos positivos con una cierta probabilidad. valores tradicionalmente no aparecen en este marco.
Si encontramos un valor de 0.01, esto no significa que la tasa de error de tipo 1 sea 0.01, el error de tipo 1 se indica a priori. Creo que este es uno de los principales argumentos en el debate de Fisher vs NP, porque los valores menudo se informan como 0.05 *, 0.01 **, 0.001 ***. Esto podría inducir a error a las personas a decir que el efecto es significativo con un cierto valor , en lugar de un cierto valor de significación.p
También me doy cuenta de que el valor es una función del tamaño de la muestra. Por lo tanto, no se puede usar como una medida absoluta. Un valor pequeño podría apuntar a un efecto pequeño y no relevante en un experimento de muestra grande. Para contrarrestar esto, es importante realizar un cálculo del tamaño de potencia / efecto al determinar el tamaño de la muestra para su experimento. valores nos dicen si hay un efecto, no qué tan grande es. Ver Sullivan 2012 .p P
Mi pregunta: ¿cómo puedo conciliar los hechos de que el valor es una medida de sorpresa (más pequeño = más convincente) mientras que al mismo tiempo no puede verse como una medida absoluta?
Lo que me confunde es lo siguiente: ¿podemos tener más confianza en un valor pequeño que en uno grande? En el sentido de los pescadores, diría que sí, estamos más sorprendidos. En el marco de NP, elegir un nivel de significancia menor implicaría que nos estamos protegiendo con más fuerza contra los falsos positivos.
Pero, por otro lado, los valores dependen del tamaño de la muestra. No son una medida absoluta. Por lo tanto, no podemos decir simplemente que 0.001593 es más significativo que 0.0439. Sin embargo, esto es lo que estaría implícito en el marco de Fisher: estaríamos más sorprendidos ante un valor tan extremo. Incluso hay discusión sobre el término altamente significativo como un nombre inapropiado: ¿Es incorrecto referirse a los resultados como "altamente significativo"?
Escuché que los valores en algunos campos de la ciencia solo se consideran importantes cuando son menores que 0.0001, mientras que en otros campos, los valores alrededor de 0.01 ya se consideran altamente significativos.
Preguntas relacionadas: