Si doy dos cuantiles y sus ubicaciones correspondientes (cada uno) en el intervalo abierto , ¿siempre puedo encontrar parámetros de una distribución beta que tenga esos cuantiles en las ubicaciones especificadas?
Si doy dos cuantiles y sus ubicaciones correspondientes (cada uno) en el intervalo abierto , ¿siempre puedo encontrar parámetros de una distribución beta que tenga esos cuantiles en las ubicaciones especificadas?
Respuestas:
La respuesta es sí, siempre que los datos satisfagan los requisitos de coherencia obvios. El argumento es sencillo, basado en una construcción simple, pero requiere cierta configuración. Se reduce a un hecho intuitivamente atractiva: incrementar el parámetro de en una Beta distribución aumenta el valor de su densidad (PDF) más para grandes que más pequeños ; y aumentar hace lo contrario: cuanto menor es , más aumenta el valor del PDF.
Los detalles siguen.
Deje que el deseado sea y el cuantil deseado sea con y (por lo tanto) . Luego hay y únicos para los cuales la distribución Beta tiene estos cuantiles.a b ( a , b )
La dificultad para demostrar esto es que la distribución Beta implica una constante de normalización recalcitrante. Recuerde la definición: para y , la distribución Beta tiene una función de densidad (PDF)
La constante de normalización es la función Beta.
Todo se vuelve desordenado si tratamos de diferenciar directamente con respecto a y , que sería la forma de fuerza bruta para intentar una demostración.
Una forma de evitar tener que analizar la función Beta es notar que los cuantiles son áreas relativas . Es decir,
para . Aquí, por ejemplo, están el PDF y la función de distribución acumulativa (CDF) de una distribución Beta para la cual y .
La función de densidad se representa a la izquierda. es el área debajo de la curva a la izquierda de , que se muestra en rojo, en relación con el área total debajo de la curva. es el área a la izquierda de , igual a la suma de las regiones roja y azul, nuevamente en relación con el área total . El CDF de la derecha muestra cómo y marcan dos puntos distintos en él.x 1 q 2 x 2 ( x 1 , q 1 ) ( x 2 , q 2 )
En esta figura, se establece en , fue seleccionado para ser , y luego un valor de se encontró para los que se encuentra en la Beta CDF.
Lema : Tal siempre se puede encontrar.
Para ser específico, deje que una vez por todas. (Se mantienen igual en las siguientes ilustraciones: en los tres casos, el área relativa a la izquierda de es igual a .) Para cualquier , el Lema afirma que hay un valor único de , escrito para el cual es el cuantil de la distribución Beta .
Para ver por qué, observe primero que cuando aproxima a cero, toda la probabilidad se acumula cerca de los valores de , de donde aproxima a . Cuando acerca al infinito, toda la probabilidad se acumula cerca de los valores de , de donde aproxima a . En el medio, la función aumenta estrictamente en .
Esta afirmación es geométricamente obvia: equivale a decir que si miramos el área a la izquierda debajo de la curva relación con el área total debajo la curva y compárelo con el área relativa debajo de la curva para , entonces la última área es relativamente más grande La relación de estas dos funciones es . Esta es una función igual a cuando cayendo constantemente a cuando Por lo tanto, las alturas de la función son relativamente más grandes que las alturas de para a la izquierda de de lo que son para a la derecha de En consecuencia, el área a la izquierda de en el primero debe ser relativamente más grande que el área a la derecha de (Esto es fácil de traducir en un argumento riguroso usando una suma de Riemann, por ejemplo).
Hemos visto que la función aumenta estrictamente monotónicamente con valores limitantes en y como y respectivamente. También es (claramente) continuo. En consecuencia, existe un número donde y ese número es único, lo que demuestra el lema.
El mismo argumento muestra que a medida que aumenta, el área a la izquierda de aumenta. Por consiguiente, los valores de rango sobre un cierto intervalo de números como progresa desde casi a casi El límite de como es
Aquí hay un ejemplo donde está cerca de (es igual a ). Con y (como en la figura anterior), Casi no hay área entre y
El CDF es prácticamente plano entre y donde está prácticamente encima de En el límite como ,
En el otro extremo, valores suficientemente grandes de derivación a arbitrariamente cerca de Aquí hay un ejemplo con como antes.
Aquí y es casi Ahora es esencialmente no hay casi ninguna área a la derecha de
En consecuencia, puede seleccionar cualquier entre y y ajustar hasta Al igual que antes, esto debe ser único, QED .
El R
código de trabajo para encontrar soluciones se publica en Determinación de los parámetros de distribución beta y desde dos puntos arbitrarios (cuantiles)β .