Tengo un conjunto de datos de 482 observaciones.
data=Populationfull
Voy a hacer un análisis de asociación de genotipo para 3 SNP. Estoy tratando de construir un modelo para mi análisis y estoy usando el aov (y ~ x, data = ...). Para un rasgo tengo varios efectos fijos y covariables que he incluido en el modelo, así:
Starts <- aov(Starts~Sex+DMRT3+Birthyear+Country+Earnings+Voltsec+Autosec, data=Populationfull) summary(Starts) Df Sum Sq Mean Sq F value Pr(>F) Sex 3 17.90 5.97 42.844 < 2e-16 *** DMRT3 2 1.14 0.57 4.110 0.017 * Birthyear 9 5.59 0.62 4.461 1.26e-05 *** Country 1 11.28 11.28 81.005 < 2e-16 *** Earnings 1 109.01 109.01 782.838 < 2e-16 *** Voltsec 1 12.27 12.27 88.086 < 2e-16 *** Autosec 1 8.97 8.97 64.443 8.27e-15 *** Residuals 463 64.48 0.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Descubrí que si cambiaba el orden de las variables en el modelo, obtenía diferentes valores de p, por favor vea a continuación.
Starts2 <- aov(Starts~Voltsec+Autosec+Sex+DMRT3+Birthyear+Country+Earnings, data=Populationfull) summary(Starts2) Df Sum Sq Mean Sq F value Pr(>F) Voltsec 1 2.18 2.18 15.627 8.92e-05 *** Autosec 1 100.60 100.60 722.443 < 2e-16 *** Sex 3 10.43 3.48 24.962 5.50e-15 *** DMRT3 2 0.82 0.41 2.957 0.05294 . Birthyear 9 3.25 0.36 2.591 0.00638 ** Country 1 2.25 2.25 16.183 6.72e-05 *** Earnings 1 46.64 46.64 334.903 < 2e-16 *** Residuals 463 64.48 0.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
¿Por qué obtengo diferentes valores de p según el orden en que se codifican las variables / factores / covariables / efectos fijos (?)? ¿Hay alguna forma de "corregirlo"? ¿Puede ser que estoy usando el modelo equivocado? Todavía soy bastante nuevo en R, así que si puedes ayudarme con esto, hazlo realmente simple para que pueda entender la respuesta jeje ... ¡Gracias, espero que alguien pueda ayudarme a entender esto!
Earnings 1 109.01 109.01 782.838 < 2e-16 ***
tu segunda carrera Earnings 1 46.64 46.64 334.903 < 2e-16 ***
. Tus resultados no son los mismos. Comience verificando que no haya hecho más que reordenar variables.
car
paquete: implementa ANOVA Tipo II y Tipo III, que no dependen del orden de las variables, mientras que lo aov
hace ANOVA Tipo I.
Populationfull
que su problema sea reproducible . Esto no sucede con el ejemplo de laaov()
página de ayuda.summary(aov(yield ~ block + N + P + K, npk)); summary(aov(yield ~ K + P + block + N , npk))