Variables filogenéticas dependientes: ¿ANOVA?

13

Entiendo que derivar una matriz de covarianza a partir de datos filogenéticos para hacer para dos variables en las que está haciendo una regresión. Pero, ¿qué sucede si tiene una variable continua, que previamente ha demostrado que depende de la filogenia, y una variable ordinal? Siendo este último ordinal, no estoy seguro de cómo relacionar esto con la forma en que la dependencia filogenética da como resultado estadísticas de prueba sesgadas. $cov(X,Y) = 0$

¿Tiene sentido calcular los contrastes filogenéticos independientes de Felsenstein en su variable continua y utilizarlos para su ANOVA?

El valor PIC es:

C_{i j} = \frac{(X_{i} - X_{j})}{\sqrt{d_{i j}}}

$C_{ij} = \frac{(X_i - X_j)}{\sqrt{d_{ij}}}$

Donde es para la especie es para la especie , y es la distancia por parejas entre las especies $X_i$ $X$ $i, X_j$ $X$ $j$ $d_{ij}$ y en el árbol filogenético. $i$ $j$

anova phylogeny

— usuario1134516
fuente

1

Hay suficientes estadísticos aplicados en CrossValidated que podríamos considerar migrar esto al sitio de estadísticas.

— Daniel Standage

2

Recomiendo la lista de correo r-sig-phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Incluso si no está utilizando R para su análisis, obtendrá muy buenas respuestas a su pregunta.

— kmm

1

El primer paso que recomendaría es introducir una variable ficticia para cada una de las clases ordinales (ver comentarios en https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta .edu / facultad / kunovich / Soci5304_Handouts / Topic% 25208_Dummy% 2520Variables.doc & cd = 2 & ved = 0CCAQFjAB & usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ & sig2 = 9hKDU de la tasa de rendimiento de la tasa de interés de los productos. También puede probar una tendencia en las propias variables ficticias. También puede reordenar la categoría de variable ordinal según la magnitud estimada respectiva de las variables ficticias para su posterior análisis si existe una justificación previa (para ver los datos actuales) para hacerlo.

Asumiendo que al análisis anterior le falta un efecto de tendencia creciente (no necesariamente lineal) e incorporando cualquier orden soportable en la propia variable ordinal, un enfoque interesante que también aborda posibles problemas de normalidad, es realizar un análisis de regresión en el que todas las variables se asignan a rangos, incluyendo la variable ordinal. Una razón para esta locura, para citar de Wikipedia sobre el coeficiente de correlación de rango de Spearman (enlace: http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient):

"El coeficiente de Spearman, como cualquier cálculo de correlación, es apropiado para variables continuas y discretas, incluidas las variables ordinales. [1] [2]"

Wikipedia presenta un ejemplo y varias formas de evaluar el error estándar de la correlación de rango calculada para las pruebas. Tenga en cuenta que si no es estadísticamente diferente de cero, entonces una versión escalada, como en una regresión calculada basada en rangos, tampoco es significativa.

Normalizaría aún más estos rangos (dividiendo por el número de observaciones), dando una posible interpretación de cuantiles de muestra (nota, hay posibles mejoras en la construcción de la distribución empírica de los datos en cuestión). También realizaría una correlación simple entre y y una variable ordinal transformada dada para que la dirección de su clasificación seleccionada (por ejemplo, 1 a 4 versus 4 a 1), produzca un signo para la correlación de rango que tiene un significado intuitivo en el contexto de tu estudio

[Editar] Tenga en cuenta que los modelos ANOVA pueden presentarse en formato de regresión con la matriz de diseño adecuada, y con cualquier modelo de regresión estándar que investigue, el tema central es un análisis basado en la media de Y dada X. Sin embargo, en algunas disciplinas como la ecología, un enfoque diferente en las relaciones de regresión implicadas en varios cuantiles, incluida la mediana, ha resultado fructífero. Aparentemente, en ecología, los efectos medios pueden ser pequeños, pero no necesariamente en otros cuantiles. Este campo se llama regresión cuantil. Sugeriría que lo emplee para complementar su análisis actual. Como referencia, puede encontrar útil el Documento 213-30, "Introducción a la regresión cuantil y el procedimiento QUANTREG" de Colin (Lin) Chen en el Instituto SAS.

Aquí también hay una fuente sobre el uso de transformaciones de rango: "El uso de transformaciones de rango en la regresión" por Ronald L. Iman y WJ Conover, publicado en Technometrics, Vol. 21, No. 4, noviembre de 1979. El artículo señala que las regresiones El empleo de transformaciones de rango parece funcionar bastante bien con datos monótonos. Esta opinión también es compartida por profesionales de la confiabilidad, quienes afirman en una revista en línea, para citar: "El método de estimación de regresión de rango es bastante bueno para funciones que pueden linealizarse". Fuente: "Reliability Hotwire, número 10, diciembre de 2010.

— AJKOER
fuente

un usuario anónimo ha estado intentando realizar ediciones bastante extensas (IMO) en su publicación. Si no está de acuerdo con ellos, puede revertirlos haciendo clic en el enlace "editado hace __", buscando la última versión que prefiere y haciendo clic en "revertir".

— gung - Restablece a Monica

0

Una prueba filogenética de ANOVA fue desarrollada por Garland et al. (1993) , y se implementa en la phy.anovafunción del geigerpaquete. El método produce valores p corregidos para la no-independencia filogenética generando una distribución nula basada en la simulación de la evolución de la filogenia.

— Loris lento
fuente