Aparentemente existe cierta confusión en cuanto a qué es una familia de distribuciones y cómo contar los parámetros libres versus los parámetros libres más fijos (asignados). Esas preguntas son un aparte que no está relacionado con la intención del OP y de esta respuesta. No uso la palabra familia aquí porque es confusa. Por ejemplo, una familia según una fuente es el resultado de variar el parámetro de forma. @whuber afirma que una "parametrización" de una familia es un mapa continuo desde un subconjunto de ℝ , con su topología habitual, en el espacio de distribuciones, cuya imagen es esa familia. n Usaré la forma de la palabra que cubre tanto el uso previsto de la palabra x 2 -2x+4 a 2 x 2 + a 1 x+ a 0 a 1 =0 a 2 =0identificación y conteo familiar y de parámetros . Por ejemplo, la fórmulatiene la forma de una fórmula cuadrática, es decir,y sila fórmula sigue siendo de forma cuadrática. Sin embargo, cuandola fórmula es lineal y la forma ya no es lo suficientemente completa como para contener un término de forma cuadrática. Se alienta a quienes deseen usar la palabra familia en un contexto estadístico adecuado a contribuir a esa pregunta por separado .x2−2x+4a2x2+a1x+a0a1=0a2=0
Respondamos a la pregunta "¿Pueden tener diferentes momentos superiores?". Hay muchos ejemplos de este tipo. Notamos de paso que la pregunta parece ser sobre PDF simétricos, que son los que tienden a tener ubicación y escala en el caso simple de dos parámetros. La lógica: suponga que hay dos funciones de densidad con formas diferentes que tienen dos parámetros idénticos (ubicación, escala). Luego hay un parámetro de forma que ajusta la forma o las funciones de densidad no tienen un parámetro de forma común y, por lo tanto, son funciones de densidad de forma no común.
Aquí, hay un ejemplo de cómo el parámetro de forma figura en él. La función de densidad de error generalizada y aquí , es una respuesta que parece tener una curtosis libremente seleccionable.
Por Skbkekas - Trabajo propio, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753
El PDF (también conocido como función de densidad "probabilidad", tenga en cuenta que la palabra "probabilidad" es superflua) esβ2αΓ(1β)e−(|x−μ|α)β
La media y la ubicación son , la escala es y es la forma. Tenga en cuenta que es más fácil presentar archivos PDF simétricos, porque esos archivos PDF a menudo tienen ubicación y escala como los dos casos de parámetros más simples, mientras que los PDF asimétricos, como el PDF gamma , tienden a tener forma y escala como sus parámetros de caso más simples. Continuando con la función de densidad de error, la varianza es , la asimetría es y la curtosis esμαβα 2 Γ ( 3α2Γ(3β)Γ(1β)0Γ(5β)Γ(1β)Γ(3β)2−3. Por lo tanto, si establecemos la varianza en 1, entonces asignamos el valor de desde mientras se varía , de modo que la curtosis se puede seleccionar en el rango de a .αα2=Γ(1β)Γ(3β)β>0−0.601114∞
Es decir, si queremos variar los momentos de orden superior, y si queremos mantener una media de cero y una varianza de 1, debemos variar la forma. Esto implica tres parámetros, que en general son 1) la media o la medida apropiada de ubicación, 2) la escala para ajustar la varianza u otra medida de variabilidad, y 3) la forma. TOMA al menos TRES PARÁMETROS PARA HACERLO.
Tenga en cuenta que si hacemos las sustituciones , en el PDF anterior, obtenemosβ=2α=2–√σe−(x−μ)22σ22π−−√σ,
que es la función de densidad de una distribución normal. Por lo tanto, la función de densidad de error generalizada es una generalización de la función de densidad de la distribución normal. Hay muchas formas de generalizar la función de densidad de una distribución normal. Otro ejemplo, pero con la función de densidad de la distribución normal solo como un valor límite, y no con valores de sustitución de rango medio como la función de densidad de error generalizada, es la función de densidad de Student . Usando la función de densidad de Student , tendríamos una selección de curtosis bastante más restringida, y es el parámetro de forma porque el segundo momento no existe para . Por otra parte, df−t−tdf≥2df<2≥ 1 - t df → ∞en realidad no está limitado a valores enteros positivos, en general es real . El Student solo se normaliza en el límite como , por lo que no lo elegí como ejemplo. No es un buen ejemplo ni un contraejemplo, y en esto no estoy de acuerdo con @ Xi'an y @whuber.≥1−tdf→∞
Déjame explicarte esto más a fondo. Se pueden elegir dos de muchas funciones de densidad arbitrarias de dos parámetros para tener, por ejemplo, una media de cero y una varianza de uno. Sin embargo, no todos serán de la misma forma. Sin embargo, la pregunta se relaciona con las funciones de densidad de la MISMA forma, no con formas diferentes. Se ha afirmado que las funciones de densidad que tienen la misma forma es una asignación arbitraria, ya que es una cuestión de definición, y en eso mi opinión difiere. No estoy de acuerdo en que esto sea arbitrario porque uno puede hacer una sustitución para convertir una función de densidad en otra, o no se puede. En el primer caso, las funciones de densidad son similares, y si por sustitución podemos mostrar que las funciones de densidad no son equivalentes, entonces esas funciones de densidad son de forma diferente.
Por lo tanto, utilizando el ejemplo del PDF de Student , las opciones son considerarlo como una generalización de un PDF normal, en cuyo caso un PDF normal tiene una forma permitida para un PDF de Student , o no, en cuyo caso, el PDF del estudiante tiene una forma diferente del PDF normal y, por lo tanto, es irrelevante para la pregunta planteada .−t−t−t
Podemos argumentar esto de muchas maneras. Mi opinión es que un PDF normal es una forma sub-seleccionada del PDF de Student , pero que un PDF normal no es una sub-selección de un PDF gamma a pesar de que puede mostrarse un valor límite de un PDF gamma ser un PDF normal, y, mi razón para esto es que en el caso normal / Student ' , el soporte es el mismo, pero en el caso normal / gamma el soporte es infinito versus semi-infinito, que es la incompatibilidad requerida .−t−t