La idea básica de la regresión cuantil proviene del hecho de que el analista está interesado en la distribución de datos y no solo en la media de los datos. Comencemos con la media.
La regresión media ajusta una línea de la forma de a la media de los datos. En otras palabras, E ( Y | X = x ) = x β . Un enfoque general para estimar esta línea es usar el método de mínimos cuadrados, arg min β ( y - x β ) ′ ( y - X β ) .y= Xβmi( YEl | X= x ) = x βargminβ( y- x β)′(y-Xβ)
Por otro lado, la regresión mediana busca una línea que espere que la mitad de los datos estén en lados. En este caso, la función objetivo es donde | . El | Es la primera norma.argminβEl | y- XβEl |El | . El |
Extender la idea de mediana a resultados cuantiles en la regresión cuantil. La idea detrás es encontrar una línea en la que el porcentaje de datos esté más allá de eso.α
Aquí cometió un pequeño error, la regresión Q no es como encontrar un cuantil de datos y luego ajustar una línea a ese subconjunto (o incluso los bordes que son más desafiantes).
La regresión Q busca una línea que divida los datos en un grupo q un cuantil y los restos. Función objetivo, diciendo función de comprobación de Q-regresión es
β alpha = arg min β { alpha | y - X β | I ( y > X β ) + ( 1 - α ) | y - X β | I ( y < X β ) } .α
β^α= argminβ{ α| y- XβEl | yo( y> Xβ) + ( 1 - α ) | y- XβEl | yo( y< Xβ) } .
Como puede ver, esta inteligente función objetivo no es más que traducir cuantil a un problema de optimización.
βα