¿Cómo debo modelar las interacciones entre variables explicativas cuando una de ellas puede tener términos cuadráticos y cúbicos?

Sinceramente espero haber formulado esta pregunta de tal manera que pueda responderse definitivamente; si no, ¡hágamelo saber y volveré a intentarlo! También debería adivinar que utilizaré R para estos análisis.

Tengo varias medidas de las plant performance (Ys)que sospecho que fueron influenciadas por cuatro tratamientos que impuse flower thinning (X1), fertilization (X2), leaf clipping (X3), y biased flower thinning (X4). Para todos los Y posibles, N es al menos 242, por lo que mis tamaños de muestra fueron grandes. Todas las parcelas se sometieron a adelgazamiento o no, pero cada parcela también se sometió a uno (y solo uno) de los otros tres tratamientos (o no, también hubo parcelas de control). La idea de este diseño era probar si los otros tres tratamientos eran capaces de "enmascarar" o "mejorar" los efectos del adelgazamiento. Por lo tanto, por diseño, los últimos tres tratamientos (X2-X4) no pudieron interactuar entre sí porque no se cruzaron, pero cada uno puede interactuar con el adelgazamiento de las flores, y probablemente lo hagan.

Mis hipótesis explícitas son que 1) el adelgazamiento de la floración será significativo y que 2) los términos de interacción X1*X2, X1*X3, and X1*X4,entre el adelgazamiento de las flores y los otros tres tratamientos también serán significativos. Es decir, el adelgazamiento de las flores debería importar, pero las formas en que importa deberían modificarse significativamente por lo que hicieron los otros tres tratamientos.

Me gustaría incluir toda esta información en un modelo mixto:

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

Pero hay un problema: tengo buenas razones para creer que los efectos del adelgazamiento en Y no son lineales. Probablemente son cuadráticos, pero tal vez incluso cúbicos en algunos casos. Esto se debe a que es muy probable que los efectos del adelgazamiento sobre el rendimiento aumenten más rápidamente a niveles más altos de adelgazamiento. Si trato de modelar esta relación no lineal a través de la ecuación anterior agregando términos cuadráticos y cúbicos para X1, entonces no estoy seguro de cómo modelar los términos de interacción: ¿se supone que debo incluir todas las combinaciones posibles de X1, (X1) ^ 2 y (X1) ^ 3 * X2, X3 y X4? Porque eso parece una gran cantidad de parámetros para tratar de estimar, incluso con la cantidad de puntos de datos que tengo, y no estoy seguro de cómo interpretar los resultados que obtendría. Dicho esto, no tengo ninguna razón biológica para pensar que esta sería una manera imprudente de modelar la situación.

Entonces, tengo tres pensamientos sobre cómo abordar este problema:

Primero, ajuste un modelo más pequeño, por ejemplo Y ~ X1 + X1^2 + X^3 + Random effects, con el único objetivo de determinar si la relación entre adelgazamiento e Y es lineal, cuadrática o cúbica, y luego transforme el adelgazamiento a través de una raíz cuadrada o cúbica para linealizar la relación adecuadamente. A partir de ahí, los términos de interacción se pueden modelar como anteriormente con la variable transformada.

Suponga que las interacciones significativas, si ocurren, afectan solo uno de los términos X1 (es decir, solo el término lineal, cuadrático o cúbico), y modele las interacciones en consecuencia. Ni siquiera estoy seguro de si este enfoque tiene sentido.

Simplemente ajuste el "modelo completo" con cada término de interacción posible entre los términos de adelgazamiento y los otros tratamientos como se discutió anteriormente. Luego, elimine términos de interacción insignificantes y use gráficos y otras técnicas para interpretar los resultados.

¿Cuál de estos enfoques, si alguno, tiene más sentido y por qué, dado que estoy interesado en la prueba de hipótesis y no en la selección de modelos? En particular, si el # 1 anterior no tiene sentido, ¿por qué es eso? ¡He leído este artículo y este artículo y he tratado de digerir lo que podrían significar para mí, pero cualquier fuente de lecturas adicionales también sería muy apreciada!

— Bajcz
fuente

Respuestas:

Ninguno de esos enfoques funcionará correctamente. El enfoque 3. se acercó, pero luego dijiste que eliminarías términos insignificantes. Esto es problemático porque las co-linealidades hacen que sea imposible encontrar qué términos eliminar, y porque esto le daría los grados de libertad incorrectos en las pruebas de hipótesis si desea preservar el error tipo I.

rms $Y$

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

Cuando vea la anovatabla, verá líneas etiquetadas All Interactionsque para todo el modelo prueban la influencia combinada de todos los términos de interacción. Para un predictor individual, esto solo es útil cuando el predictor interactúa con más de una variable. Hay una opción en el printmétodo para anova.rmsmostrar por cada línea en la tabla exactamente qué parámetros se están probando contra cero. Todo esto funciona con mezclas de predictores categóricos y continuos.

Si desea usar polinomios ordinarios, use en pollugar de rcs.

Lamentablemente, no he implementado modelos de efectos mixtos.

— Frank Harrell
fuente

Gracias por esta respuesta Nunca he usado splines antes, pero creo que entiendo tu ejemplo. Tengo algunas preguntas de seguimiento, si está bien. 1. Al observar los resultados de anova de los ols, como en su ejemplo, ¿qué se entiende por "Todas las interacciones" debajo de un factor? Es decir, ¿todas las interacciones con qué? 2. ¿Se permitirá un enfoque similar en un enfoque de modelado mixto? Creo que estoy atrapado con la necesidad de factores aleatorios. ¿Su ejemplo es compatible con, por ejemplo, lme4? 3. ¿Funcionará esto si algunos de los tratamientos interactivos son categóricos? Por ejemplo, ¿qué pasaría si X2 fuera un factor de 2 niveles?

— Bajcz

Soy fanático de usar regresiones de suavizado no paramétricas para evaluar formas funcionales de relaciones entre variables dependientes y predictores, incluso cuando posteriormente voy a estimar modelos de regresión paramétrica. Aunque a menudo he encontrado relaciones no lineales, nunca he encontrado un término de interacción de interacción no lineal, incluso cuando los efectos principales son fuertemente no lineales. Lo que me llevo a casa: los efectos de interacción no necesitan estar compuestos de las mismas formas funcionales que los predictores de los que están compuestos.

— Alexis
fuente

Entonces, para aclarar, su decisión es que si elijo la opción n. ° 2, puedo incluir de forma segura términos de interacción con el término lineal X1 y no preocuparme por los "términos de interacción de orden superior", por ejemplo, X1 ^ 2 * X3, etc.

— Bajcz

@Bajcz Bueno ... supongo que estoy diciendo dos cosas: (1) Me las arreglé para salir adelante en los conjuntos de datos que he encontrado con interacciones solo lineales, pero también (2) Me gusta mirar (usando regresiones no paramétricas) y dejar que los datos me digan si debo considerar alternativas no lineales o no. [Adoptar un enfoque de prueba de hipótesis o ajuste de modelo para términos no lineales es la OMI de la manera incorrecta de hacerlo, ya que eso implica, por ejemplo, inferencia basada, por ejemplo, en un conjunto arbitrario de términos polinómicos, en lugar de los datos en sí mismos].

— Alexis

No hay una gran razón para creer que las interacciones sean más propensas a ser lineales. Me he encontrado con excelentes ejemplos de interacciones no lineales. La idea de "mirar" y "dejar que los datos le digan" está plagada de problemas de inferencia, incluidos problemas de cobertura de intervalo de mala confianza.

— Frank Harrell

@FrankHarrell ¡Gracias! Su primera oración es exactamente el punto que estaba tratando de transmitir en mi (2) en el comentario anterior (mi experiencia pasada puede variar dramáticamente en el futuro). OTOH: no dejar que los datos hablen es una gran estrategia para imponer inferencias sobre artefactos de supuestos de modelado en inferencias sobre los datos reales.

— Alexis