En pocas palabras , cuanto más aprendo sobre estadísticas, menos confío en los trabajos publicados en mi campo; Simplemente creo que los investigadores no están haciendo sus estadísticas lo suficientemente bien.
Soy un laico, por así decirlo. Estoy entrenado en biología pero no tengo educación formal en estadística o matemáticas. Disfruto de R y, a menudo, hago un esfuerzo por leer (y comprender ...) algunos de los fundamentos teóricos de los métodos que aplico al hacer investigación. No me sorprendería si la mayoría de las personas que realizan análisis hoy no están formadas formalmente. He publicado alrededor de 20 artículos originales, algunos de los cuales han sido aceptados por revistas y estadísticos reconocidos que han participado con frecuencia en el proceso de revisión. Mis análisis comúnmente incluyen análisis de supervivencia, regresión lineal, regresión logística, modelos mixtos. Nunca un crítico ha preguntado sobre supuestos, ajuste o evaluación del modelo.
Por lo tanto, nunca me molesté demasiado sobre los supuestos, el ajuste y la evaluación del modelo. Comienzo con una hipótesis, ejecuto la regresión y luego presento los resultados. En algunos casos hice un esfuerzo por evaluar estas cosas, pero siempre terminé con " bueno, no cumplía con todos los supuestos, pero confío en los resultados (" conocimiento de la materia ") y son plausibles, así que está bien " y Al consultar a un estadístico, siempre parecían estar de acuerdo.
Ahora, he hablado con otros estadísticos y no estadísticos (químicos, médicos y biólogos) que realizan análisis ellos mismos; parece que la gente realmente no se preocupa demasiado por todos estos supuestos y evaluaciones formales. Pero aquí en CV, hay una gran cantidad de personas que preguntan sobre los residuos, el ajuste del modelo, las formas de evaluarlo, los valores propios, los vectores y la lista continúa. Permítanme decirlo de esta manera, cuando lme4 advierte sobre grandes valores propios, dudo mucho que a muchos de sus usuarios les importe abordar eso ...
¿Vale la pena el esfuerzo extra? ¿No es probable que la mayoría de los resultados publicados no respeten estos supuestos y tal vez ni siquiera los hayan evaluado? Este es probablemente un problema cada vez mayor ya que las bases de datos crecen cada día y existe la noción de que cuanto más grandes sean los datos, menos importantes serán los supuestos y las evaluaciones.
Podría estar absolutamente equivocado, pero así es como lo he percibido.
Actualización: Cita prestada de StasK (abajo): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509