Estoy usando el paquete quantreg para hacer un modelo de regresión usando el percentil 99 de mis valores en un conjunto de datos. Basado en el consejo de una pregunta anterior de stackoverflow que hice, utilicé la siguiente estructura de código.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
que muestro graficado en la parte superior de mis datos. He trazado esto usando ggplot2, con un valor alfa para los puntos. Creo que la cola de mi distribución no se considera suficientemente en mi análisis. Quizás esto se deba al hecho de que hay puntos individuales, que están siendo ignorados por la medición del tipo de percentil.
Uno de los comentarios sugirió que
La viñeta del paquete incluye secciones sobre regresión cuantil no lineal y también modelos con splines de suavizado, etc.
Basado en mi pregunta anterior, asumí una relación logarítmica, pero no estoy seguro de si eso es correcto. Pensé que podría extraer todos los puntos en el intervalo del percentil 99 y luego examinarlos por separado, pero no estoy seguro de cómo hacerlo, o si ese es un buen enfoque. Agradecería cualquier consejo sobre cómo mejorar la identificación de esta relación.