¿El LSD de Fisher es tan malo como dicen?


22

Cuando realizamos experimentos (en tamaños de muestra pequeños (generalmente el tamaño de muestra por grupo de tratamiento es de aproximadamente 7 ~ 8)) en dos grupos, utilizamos una prueba t para comprobar la diferencia. Sin embargo, cuando realizamos un ANOVA (obviamente para más de dos grupos), usamos algo similar a Bonferroni (LSD / # de comparaciones por pares) o Tukey's como un post hoc, y como estudiante, me han advertido de utilizando la menor diferencia significativa de Fisher (LSD).

Ahora la cuestión es que el LSD es similar a la prueba t por pares (¿estoy en lo cierto?), Por lo que lo único que no tiene en cuenta es que estamos haciendo comparaciones múltiples. ¿Qué tan importante es eso cuando se trata con digamos 6 grupos, si el ANOVA es en sí mismo significativo?

O en otras palabras, ¿hay alguna razón científica / estadística para usar un LSD de Fisher?


1
¿Podría aclarar quiénes son " ellos " e incluir ejemplos de lo que dicen? (¿Qué tan malo dicen que es? Seamos claros lo que estamos discutiendo aquí.) He visto algunas críticas al LSD, algunas de ellas justificadas, pero no sé si he visto lo que has visto. visto, ni que lo que he visto requeriría bastante la caracterización que tienes allí.
Glen_b -Reinstate Monica

+1 si viniste aquí tratando de descubrir qué sitio de intercambio de pila habla sobre Timothy Learys LSD
PW Kad

@Glen_b Se refieren a científicos en ciencias biomédicas. Las palabras de mi profesor fueron, para citar "Use Bonferroni o Tukey. Use LSD solo con desesperación. Si eso no ayuda, use el otro LSD :)"
Rover Eye

Respuestas:


10

El LSD de Fisher es, de hecho, una serie de pruebas t por pares, y cada prueba utiliza el error cuadrático medio del ANOVA significativo como su estimación de la varianza agrupada (y, naturalmente, toma los grados de libertad asociados). Que el ANOVA sea significativo es una restricción adicional de esta prueba.

Restringe la tasa de error familiar a alfa en el caso especial de solo 3 grupos. Howell tiene una explicación muy buena y relativamente simple de cómo lo hace en el Capítulo 16 de su libro Estadísticas fundamentales para las ciencias del comportamiento, octava edición, David C. Howell .

Por encima de 3 grupos, el alfa se infla rápidamente (como @Alexis ha indicado anteriormente). Ciertamente no es apropiado para 6 grupos. Creo que es esta aplicabilidad limitada lo que hace que la mayoría de las personas sugieran ignorarlo como una opción.


18

¿Qué importancia tienen las comparaciones múltiples cuando se trata de 6 grupos? Bueno ... con seis grupos estás lidiando con un máximo de posiblescomparaciones por parespost hoc. Dejaré que el inestimable Randall Munroe aborde la importancia de las comparaciones múltiples:6 6(6 6-1)2=15

ingrese la descripción de la imagen aquí

Y agregaré que si, como en su oración inicial, sugiere que a veces tiene siete grupos, entonces el número máximo de pruebas por pares post hoc es 7 7(7 7-1)2=21


1
Punto bien hecho. Sin embargo, ¿esto no pone en duda que si tenemos muy pocos grupos (digamos 3 (3 pares) o 4 (6 pares) la probabilidad de encontrar un valor significativo por casualidad es baja? (de nuevo, el LSD está protegido por la importancia de ANOVA)
Rover Eye

2
α

2
@Rover Tener 6 pruebas por pares que pasan todas con p> 0.05 ya significa que ahora tiene p> 0.26, ese es un cambio bastante significativo.
Voo

No estoy preguntando nada práctico, solo estaba reflexionando en voz alta. Pero tu punto está bien hecho. @Voo cierto, el error tiende a multiplicarse. Gracias a los dos.
Rover Eye

10

La prueba de Fisher es tan mala como todos dicen que es desde el punto de vista de Neyman-Pearson y si haces lo que tu pregunta implica, después de una prueba ANOVA significativa, prueba cada diferencia individual. Puedes ver esto en muchas publicaciones artículos . Pero, probar todas las diferencias después de un ANOVA, o cualquiera de ellas, no es necesario ni recomendable. Y, la prueba de Fisher no fue diseñada bajo una teoría de inferencia estadística de Neyman-Pearson.

Es importante tener en cuenta que, cuando Fisher propuso el LSD, en realidad no consideró que las pruebas múltiples fueran un problema importante porque no consideró que el límite de importancia fuera una regla difícil y rápida para decidir si los resultados eran importantes o no. Se podría construir un LSD como una manera fácil de examinar los datos para obtener resultados significativos, pero no el árbitro de lo que era significativo. Recuerde, fue Fisher quien dijo que debería ejecutar más sujetos si p > 0.05.

¿Y por qué crees que probar todo es una buena idea? Considere por qué ejecuta un ANOVA en primer lugar. Probablemente te hayan enseñado que es porque ejecutar múltiples pruebas t es problemático, ya que intimas en tu pregunta. Entonces, ¿por qué los ejecutas, o su equivalente después? Sé que sucede, pero todavía tengo que ejecutar una prueba después de un ANOVA. Un ANOVA le dice que su patrón de datos no es un conjunto de valores iguales, que puede haber algún significado allí. Muchas personas se obsesionan con la advertencia de que la prueba no le dice dónde están los bits significativos, pero olvidan que los datos y las teorías lo dicen.


Gracias por los papeles. plantea una pregunta sobre por qué las personas usan un post-hoc después de un ANOVA. A decir verdad honesta, realmente no lo sé. Me dijeron que el ANOVA es una prueba de manchas y, como usted mencionó, necesitábamos descubrir dónde radica la importancia. Y para ser honesto, estoy interesado en saber cómo informas solo un ANOVA.
Rover Eye

1
Dame un patrón de datos y te diré cómo reportaría el ANOVA. La versión corta es que usted describe los datos. Los elementos muy cercanos entre sí se agruparían en la descripción y los que estaban muy separados se considerarían diferencias significativas (pero todo es relativo). Digamos que tengo A = 20, B = 58, C = 61, p = 0.03. Informaría la estadística y diría que A es inferior a B y C, que son similares. Entonces, todo depende de los datos. Me imagino que una secuencia de elementos es un poco problemática (A = 10, B = 20, C = 30) de alguna manera inferencial, pero tal vez debería haber hecho una regresión.
John

Esa es una forma bastante interesante de informar un ANOVA y puedo ver a qué se refiere. Si bien seguramente puedo discutir esto con mis supervisores, no estoy muy seguro de si les gustaría romper la "norma" de informar un ANOVA sin un posthoc. Intentando encontrar publicaciones científicas que hayan informado utilizando este método.
Rover Eye

2
Algo tiene sentido en los datos. Muy a menudo es obvio lo que debe ser. Hacer un post hoc para demostrar lo obvio simplemente demuestra que no sabes lo que hace ANOVA en primer lugar.
John

6

El razonamiento detrás del LSD de Fisher se puede extender a casos más allá de N = 3.

Discutiré el caso de cuatro grupos en detalle. Para mantener la tasa de error tipo I familiar en 0.05 o menos, es suficiente un factor de corrección de comparación múltiple de 3 (es decir, un alfa por comparación de 0.05 / 3), aunque hay seis comparaciones post-hoc entre los cuatro grupos. Esto es porque:

  • en caso de que las cuatro medias verdaderas sean iguales, el ómnibus Anova sobre los cuatro grupos limita la tasa de error familiar a 0.05;
  • en caso de que tres de los medios verdaderos sean iguales y el cuarto difiera de ellos, solo hay tres comparaciones que podrían generar un error Tipo I;
  • en caso de que dos de los medios verdaderos sean iguales y difieran de los otros dos, que son iguales entre sí, solo hay dos comparaciones que podrían generar un error de Tipo I.

Esto agota las posibilidades. En todos los casos, la probabilidad de encontrar uno o más valores p por debajo de 0.05 para grupos cuyas medias verdaderas son iguales, permanece en o por debajo de 0.05 si el factor de corrección para comparaciones múltiples es 3, y esta es la definición de la tasa de error familiar.

Este razonamiento para cuatro grupos es una generalización de la explicación de Fisher para su método de la diferencia menos significativa de tres grupos. Para los grupos N , el factor de corrección, si la prueba general de Anova es significativa, es ( N -1) ( N -2) / 2. Entonces, la corrección de Bonferroni, por un factor de N ( N -1) / 2, es demasiado fuerte. Es suficiente usar un factor de corrección alfa de 1 para N = 3 (es por eso que el LSD de Fisher funciona para N = 3), un factor de 3 para N = 4, un factor de 6 para N = 5, un factor de 10 para N = 6, y así sucesivamente.


+1. Esta es una muy buena adición al hilo. Bienvenido al sitio!
ameba dice Reinstate Monica

Cada situación que describió no requiere ninguna prueba post hoc.
John

1
¿Puede señalar una referencia de literatura para eso? (norte-1)(norte-2)/ /2¿resultado?
rvl
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.