La regresión cuantil no hace suposiciones de distribución, es decir, suposiciones sobre residuos, aparte de suponer que la variable de respuesta es casi continua. Si está abordando el problema de estimar un único cuantil como predictores de función X, de lejos, lo más importante que puede salir mal es la especificación errónea del predictor lineal Xβpor falta de equipamiento, es decir, no incluir efectos no lineales (un problema común) o efectos de interacción. Hay al menos dos enfoques recomendados. Primero, si el tamaño de su muestra es grande, simplemente ajuste un modelo más flexible. Un buen compromiso es permitir que todos los efectos principales sean no lineales utilizando splines de regresión, como splines cúbicos restringidos (splines naturales). Entonces no hay nada que deba verificarse excepto las interacciones. El segundo enfoque es esperar que el modelo sea simple (¿por qué?) Pero permitir que sea complejo y luego evaluar el impacto de las complejas adiciones al modelo simple. Por ejemplo, podemos evaluar las contribuciones combinadas de términos no lineales o de interacción o ambos. Sigue un ejemplo, usando la R rms
yquantreg
paquetes Se utiliza un formulario de interacción de compromiso para limitar el número de parámetros. Las interacciones están restringidas a no ser doblemente no lineales.
require(rms)
# Estimate 25th percentile of y as a function of x1 and x2
f <- Rq(y ~ rcs(x1, 4) + rcs(x2, 4) + rcs(x1, 4) %ia% rcs(x2, 4), tau=.25)
# rcs = restricted cubic spline, here with 4 default knots
# %ia% = restricted interaction
# To use general interactions (all cross product terms), use:
# f <- Rq(y ~ rcs(x1, 4)*rcs(x2, 4), tau=.25)
anova(f) # get automatic combined 'chunk' tests: nonlinearity, interaction
# anova also provides the combined test of complexity (nonlin. + interact.)