Estoy haciendo estudios de asociación GWAS SNP sobre enfermedades usando un software llamado plink ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ).
Con los resultados de la asociación obtengo valores p para todos los SNP analizados. Ahora, uso un gráfico QQ de esos valores p para mostrar si un valor p muy bajo difiere de la distribución esperada de los valores p (una distribución uniforme). Si un valor p se desvía de la distribución esperada, "puede" llamar a ese valor p para estadística significativa.
Como puede ver en el gráfico QQ, en el extremo superior de la cola, los últimos 4 puntos son algo difíciles de interpretar. Dos de los últimos puntos en el gris sugieren que esos valores p están en la distribución esperada de los valores p, mientras que los otros dos no.
Ahora, cómo interpretar esto, los dos últimos puntos tienen bajos valores de p, pero no son "significativo", según el QQ-plot, mientras que los otros dos puntos con altos valores de p son "significativo"? ¿Cómo puede ser esto cierto?