←
p>.05p<.05p>.05ing (NHST). Los malentendidos no son infrecuentes en la literatura de investigación publicada, ya que NHST es notoriamente contraintuitivo. Este es uno de los gritos de guerra de la invasión bayesiana (que apoyo, pero no sigo ... todavía). He trabajado con impresiones equivocadas como estas hasta hace poco, así que simpatizo de todo corazón.
pp ppp) , entre otras ventajas, y dejando de lado desventajas discutibles. (Para ser justos, vea " ¿Cuáles son las desventajas del análisis bayesiano? " También ha comentado para citar artículos que podrían ofrecer algunas buenas respuestas allí: Moyé, 2008; Hurlbert & Lombardi, 2009 ).
Podría decirse que la hipótesis nula, como se dice literalmente, es a menudo más probable que incorrecta, porque las hipótesis nulas son más comúnmente, literalmente, hipótesis de efecto cero . (Para algunos contraejemplos útiles, vea las respuestas a: " ¿Son inapropiados los conjuntos de datos grandes para la prueba de hipótesis? "). Los problemas filosóficos como el efecto mariposa amenazan la validez literal de cualquier hipótesis; por lo tanto, el valor nulo es útil en general como base de comparación para una hipótesis alternativa de algún efecto distinto de cero. Tal hipótesis alternativa puede seguir siendo más plausible que la nula después de que se hayan recopilado datos que habrían sido improbables si la nula fuera cierta. Por lo tanto, los investigadores suelen inferir el apoyo a una hipótesis alternativa a partir de la evidencia contra el nulo, pero eso no es lo que los valores p cuantifican directamente ( Wagenmakers, 2007 ) .
Como sospecha, la significación estadística es una función del tamaño de la muestra , así como del tamaño del efecto y la consistencia. (Véase @ respuesta de Gung a la reciente pregunta: " ¿Cómo puede una prueba t ser estadísticamente significativa si la diferencia media es casi 0? ") Las preguntas que a menudo propongo pedir de nuestros datos son: "¿Cuál es el efecto de x
el y
? " Por varias razones (incluida la OMI, programas educativos mal concebidos y de otra manera deficientes en estadística, especialmente según lo enseñado por no estadísticos), a menudo nos encontramos haciendo una pregunta literalmente relacionada: "¿Cuál es la probabilidad de muestrear datos como el mío al azar? de una población en la que x
no afectay
pp
.05<p<.95≠- otro de Goodman (2008) sucio docena); esto depende mucho más del significado de los datos, con lo que la significación estadística solo se refiere en cierta medida. Vea mi respuesta a lo anterior .
¿No debería ser correcto llamar a un resultado definitivamente falso (en lugar de simplemente no admitido) si ... p> 0.95?
Dado que los datos generalmente deberían representar observaciones empíricamente objetivas, no deberían ser falsos; solo las inferencias sobre ellos deberían enfrentar este riesgo, idealmente. (El error de medición también ocurre, por supuesto, pero ese problema está fuera del alcance de esta respuesta, por lo que, aparte de mencionarlo aquí, lo dejaré solo de lo contrario). Siempre existe algún riesgo de hacer una inferencia falsamente positiva sobre que el valor nulo sea menos útil que la hipótesis alternativa, al menos a menos que el inferidor sepa que el nulo es verdadero. Solo en la circunstancia bastante difícil de concebir el conocimiento de que el nulo es literalmente verdadero, una inferencia que favorezca una hipótesis alternativa es definitivamente falsa ... al menos, por lo que puedo imaginar en este momento.
Claramente, el uso generalizado o la convención no es la mejor autoridad en validez epistémica o inferencial. Incluso los recursos publicados son falibles; ver, por ejemplo, Fallacy en la definición del valor p . Su referencia ( Hurlbert y Lombardi, 2009 ) también ofrece una exposición interesante de este principio (página 322):
StatSoft (2007) se jacta en su sitio web de que su manual en línea "es el único recurso de Internet sobre estadísticas recomendado por la Enciclopedia Británica". Nunca ha sido tan importante la 'Autoridad de desconfianza', como dice la calcomanía. [URL rota cómicamente convertida en texto hipervinculado]
ppEspero poder convencer a Michael para que toque aquí etiquetándolo como lo he hecho (pero no estoy seguro de que las etiquetas de usuario envíen notificaciones cuando se editen, no creo que el suyo en el OP lo haya hecho). Él puede ser el único que puede salvar a Nuzzo, ¡incluso la naturaleza misma! ¡Ayúdanos Obi-Wan! (Y perdóneme si mi respuesta aquí demuestra que todavía no he entendido las implicaciones de su trabajo, lo que estoy seguro de que tengo en cualquier caso ...) Por cierto, Nuzzo también ofrece una intrigante autodefensa y refutación de "Problema 3" de Wagenmaakers: ver la figura "Causa probable" de Nuzzo y citas de apoyo ( Goodman, 2001 , 1992; Gorroochurn, Hodge, Heiman, Durner y Greenberg, 2007 ) . Estos solo pueden contener la respuesta que '
Re: su pregunta de opción múltiple, selecciono d
. Es posible que haya malinterpretado algunos conceptos aquí, pero ciertamente no está solo si es así, y le dejaré el juicio a usted, ya que solo usted sabe lo que realmente cree. La mala interpretación implica cierta certeza, mientras que hacer una pregunta implica lo contrario, y ese impulso de cuestionar cuando es incierto es lamentable y está lejos de ser omnipresente, desafortunadamente. Este asunto de la naturaleza humana hace que la incorrección de nuestras convenciones sea tristemente inofensiva y merezca quejas como las mencionadas aquí. (¡Gracias en parte a ti!) Sin embargo, tu propuesta tampoco es completamente correcta.
pp, Soy una autoridad débil en el mejor de los casos, y agradezco cualquier corrección o elaboración que otros puedan ofrecer a lo que he dicho aquí. Todo lo que puedo concluir es que probablemente haya una respuesta matemáticamente correcta, y puede ser que la mayoría de las personas se equivoquen. La respuesta correcta ciertamente no es fácil, como lo demuestran las siguientes referencias ...
pp
Referencias
- Goodman, SN (1992). Un comentario sobre replicación, valores P y evidencia. Estadísticas en medicina, 11 (7), 875–879.
- Goodman, SN (2001). De los valores P y Bayes: una propuesta modesta. Epidemiología, 12 (3), 295–297. Recuperado de http://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_Bayes__A_Modest_Proposal.6.pdf .
- Goodman, S. (2008). Una docena sucia: doce conceptos erróneos de valor P Seminarios en hematología, 45 (3), 135–140. Recuperado de http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf .
- Gorroochurn, P., Hodge, SE, Heiman, GA, Durner, M. y Greenberg, DA (2007). No replicación de los estudios de asociación: ¿"pseudo-fallas" para replicar? Genética en medicina, 9 (6), 325–331. Recuperado de http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html .
- Hurlbert, SH y Lombardi, CM (2009). Colapso final del marco teórico de decisión de Neyman-Pearson y surgimiento del neofisheriano. Annales Zoologici Fennici, 46 (5), 311–349. Recuperado de http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf .
- Lew, MJ (2013). Para P o no para P: Sobre la naturaleza evidencial de los valores P y su lugar en la inferencia científica. arXiv: 1311.0081 [stat.ME]. Recuperado dehttp://arxiv.org/abs/1311.0081 .
- Moyé, LA (2008). Bayesianos en ensayos clínicos: dormidos en el interruptor. Estadísticas en medicina, 27 (4), 469–482.
- Nuzzo, R. (12 de febrero de 2014). Método científico: errores estadísticos. Nature News, 506 (7487). Recuperado de http://www.nature.com/news/scientific-method-statistical-errors-1.14700 .
- Wagenmakers, EJ (2007). Una solución práctica a los problemas generalizados de los valores de p . Psychonomic Bulletin & Review, 14 (5), 779–804. Recuperado de http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf .