¿Es posible que dos variables aleatorias de la misma familia de distribución tengan la misma expectativa y varianza, pero diferentes momentos superiores?

12

Estaba pensando en el significado de familia a escala de ubicación. Entiendo que para cada miembro de una familia de escala de ubicación con parámetros ubicación y una escala , entonces la distribución de no depende de ningún parámetro y es igual para cada pertenece a esa familia. $X$ $a$ $b$ $Z =(X-a)/b$ $X$

Entonces, mi pregunta es ¿podría proporcionar un ejemplo donde dos al azar de la misma familia de distribución están estandarizados pero eso no da como resultado una variable aleatoria con la misma distribución?

Digamos que e provienen de la misma familia de distribución (donde con familia quiero decir, por ejemplo, tanto Normal como Gamma, etc.). Definir: $X$ $Y$

$Z_1 = \dfrac{X-\mu}{\sigma}$

$Z_2 = \dfrac{Y-\mu}{\sigma}$

sabemos que tanto como tienen la misma expectativa y varianza, . $Z_1$ $Z_2$ $\mu_Z =0, \sigma^2_Z =1$

¿Pero pueden tener diferentes momentos superiores?

Mi intento de responder a esta pregunta es que si la distribución de e depende de más de 2 parámetros de lo que podría ser. Y estoy pensando en el generalizado que tiene 3 parámetros. $X$ $Y$ $t-student$

Pero si el número de parámetros es y e provienen de la misma familia de distribución con la misma expectativa y varianza, ¿significa que y tienen la misma distribución (momentos más altos)? $\le2$ $X$ $Y$ $Z_1$ $Z_2$

— gioxc88
fuente

44

Sí pueden. Pero, necesitaría al menos 3 parámetros en una distribución generalizada.

— Carl

55

@Carl Un parámetro será suficiente.

— whuber

55

@Carl No está claro qué quiere decir con "misma distribución". Literalmente, eso se referiría a una distribución única, con una ley y, por lo tanto, una expectativa única, una varianza única y momentos únicos (en la medida en que se definen). Si se refiere a "la misma familia de distribución ", entonces su comentario no tiene sentido, porque la familia es lo que usted define.

— whuber

3

@ HardCore Ya que parece que siente que su pregunta ha sido respondida, vea ¿Qué debo hacer cuando alguien responde mi pregunta?

— Glen_b -Reinstate Monica

2

@Carl También voté tu respuesta. El uso del OP parece apoyar la noción de como que tiene la misma distribución estándar para todas las opciones de en la familia. Veamos qué respuesta acepta el OP (si el OP lee el comentario de Glen_b y actúa en consecuencia).

Z = (X - a) / b

$Z=(X-a)/b$

X

$X$

— Dilip Sarwate

7

Aparentemente existe cierta confusión en cuanto a qué es una familia de distribuciones y cómo contar los parámetros libres versus los parámetros libres más fijos (asignados). Esas preguntas son un aparte que no está relacionado con la intención del OP y de esta respuesta. No uso la palabra familia aquí porque es confusa. Por ejemplo, una familia según una fuente es el resultado de variar el parámetro de forma. @whuber afirma que una "parametrización" de una familia es un mapa continuo desde un subconjunto de ℝ , con su topología habitual, en el espacio de distribuciones, cuya imagen es esa familia. $^n$ Usaré la forma de la palabra que cubre tanto el uso previsto de la palabraidentificación y conteo familiar y de parámetros . Por ejemplo, la fórmulatiene la forma de una fórmula cuadrática, es decir,y sila fórmula sigue siendo de forma cuadrática. Sin embargo, cuandola fórmula es lineal y la forma ya no es lo suficientemente completa como para contener un término de forma cuadrática. Se alienta a quienes deseen usar la palabra familia en un contexto estadístico adecuado a contribuir a esa pregunta por separado . $x^2-2x+4$ $a_2x^2+a_1x+a_0$ $a_1=0$ $a_2=0$

Respondamos a la pregunta "¿Pueden tener diferentes momentos superiores?". Hay muchos ejemplos de este tipo. Notamos de paso que la pregunta parece ser sobre PDF simétricos, que son los que tienden a tener ubicación y escala en el caso simple de dos parámetros. La lógica: suponga que hay dos funciones de densidad con formas diferentes que tienen dos parámetros idénticos (ubicación, escala). Luego hay un parámetro de forma que ajusta la forma o las funciones de densidad no tienen un parámetro de forma común y, por lo tanto, son funciones de densidad de forma no común.

Aquí, hay un ejemplo de cómo el parámetro de forma figura en él. La función de densidad de error generalizada y aquí , es una respuesta que parece tener una curtosis libremente seleccionable.

Por Skbkekas - Trabajo propio, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753

El PDF (también conocido como función de densidad "probabilidad", tenga en cuenta que la palabra "probabilidad" es superflua) es

\frac{β}{2 α Γ (\frac{1}{β})} e^{- (\frac{| x - μ |}{α})^{β}}

$\dfrac{\beta}{2\alpha\Gamma\Big(\dfrac{1}{\beta}\Big)} \; e^{-\Big(\dfrac{|x-\mu|}{\alpha}\Big)^\beta}$

La media y la ubicación son , la escala es y es la forma. Tenga en cuenta que es más fácil presentar archivos PDF simétricos, porque esos archivos PDF a menudo tienen ubicación y escala como los dos casos de parámetros más simples, mientras que los PDF asimétricos, como el PDF gamma , tienden a tener forma y escala como sus parámetros de caso más simples. Continuando con la función de densidad de error, la varianza es , la asimetría es y la curtosis es $\mu$ $\alpha$ $\beta$ $\dfrac{\alpha^2\Gamma\Big(\dfrac{3}{\beta}\Big)}{\Gamma\Big(\dfrac{1}{\beta}\Big)}$ $0$ $\dfrac{\Gamma\Big(\dfrac{5}{\beta}\Big)\Gamma\Big(\dfrac{1}{\beta}\Big)}{\Gamma\Big(\dfrac{3}{\beta}\Big)^2}-3$ . Por lo tanto, si establecemos la varianza en 1, entonces asignamos el valor de desde mientras se varía , de modo que la curtosis se puede seleccionar en el rango de a . $\alpha$ $\alpha ^2=\dfrac{\Gamma \left(\dfrac{1}{\beta }\right)}{\Gamma \left(\dfrac{3}{\beta }\right)}$ $\beta>0$ $-0.601114$ $\infty$

Es decir, si queremos variar los momentos de orden superior, y si queremos mantener una media de cero y una varianza de 1, debemos variar la forma. Esto implica tres parámetros, que en general son 1) la media o la medida apropiada de ubicación, 2) la escala para ajustar la varianza u otra medida de variabilidad, y 3) la forma. TOMA al menos TRES PARÁMETROS PARA HACERLO.

Tenga en cuenta que si hacemos las sustituciones , en el PDF anterior, obtenemos $\beta=2$ $\alpha=\sqrt{2}\sigma$

\frac{e^{- \frac{(x - μ)^{2}}{2 σ^{2}}}}{\sqrt{2 π} σ},

$\frac{e^{-\frac{(x-\mu )^2}{2 \sigma ^2}}}{\sqrt{2 \pi } \sigma }\;,$

que es la función de densidad de una distribución normal. Por lo tanto, la función de densidad de error generalizada es una generalización de la función de densidad de la distribución normal. Hay muchas formas de generalizar la función de densidad de una distribución normal. Otro ejemplo, pero con la función de densidad de la distribución normal solo como un valor límite, y no con valores de sustitución de rango medio como la función de densidad de error generalizada, es la función de densidad de Student . Usando la función de densidad de Student , tendríamos una selección de curtosis bastante más restringida, y es el parámetro de forma porque el segundo momento no existe para . Por otra parte, df $-t$ $-t$ $\textit{df}\geq2$ $\textit{df}<2$ en realidad no está limitado a valores enteros positivos, en general es real . El Student solo se normaliza en el límite como , por lo que no lo elegí como ejemplo. No es un buen ejemplo ni un contraejemplo, y en esto no estoy de acuerdo con @ Xi'an y @whuber. $\geq1$ $-t$ $\textit{df}\rightarrow\infty$

Déjame explicarte esto más a fondo. Se pueden elegir dos de muchas funciones de densidad arbitrarias de dos parámetros para tener, por ejemplo, una media de cero y una varianza de uno. Sin embargo, no todos serán de la misma forma. Sin embargo, la pregunta se relaciona con las funciones de densidad de la MISMA forma, no con formas diferentes. Se ha afirmado que las funciones de densidad que tienen la misma forma es una asignación arbitraria, ya que es una cuestión de definición, y en eso mi opinión difiere. No estoy de acuerdo en que esto sea arbitrario porque uno puede hacer una sustitución para convertir una función de densidad en otra, o no se puede. En el primer caso, las funciones de densidad son similares, y si por sustitución podemos mostrar que las funciones de densidad no son equivalentes, entonces esas funciones de densidad son de forma diferente.

Por lo tanto, utilizando el ejemplo del PDF de Student , las opciones son considerarlo como una generalización de un PDF normal, en cuyo caso un PDF normal tiene una forma permitida para un PDF de Student , o no, en cuyo caso, el PDF del estudiante tiene una forma diferente del PDF normal y, por lo tanto, es irrelevante para la pregunta planteada . $-t$ $-t$ $-t$

Podemos argumentar esto de muchas maneras. Mi opinión es que un PDF normal es una forma sub-seleccionada del PDF de Student , pero que un PDF normal no es una sub-selección de un PDF gamma a pesar de que puede mostrarse un valor límite de un PDF gamma ser un PDF normal, y, mi razón para esto es que en el caso normal / Student ' , el soporte es el mismo, pero en el caso normal / gamma el soporte es infinito versus semi-infinito, que es la incompatibilidad requerida . $-t$ $-t$

— Carl
fuente

66

(-1) Como se ha indicado en otros comentarios, el problema es "¿qué significa una familia de distribución?". Puedo definir fácilmente una nueva "familia" de distribuciones que simplemente se redimensionan las distribuciones t para tener media = 0, sd = 1, con un solo parámetro: df. Luego, el primer y segundo momento son iguales para todos los df, pero para diferentes valores de df, tienen diferentes momentos más altos.

— Cliff AB

55

¡Hard Core, ese comentario es difícil de comprender, dado que su título contiene la palabra "familia"! Además, si niega que una familia sea significativa, entonces la pregunta no tiene sentido. Por favor aclare editando su pregunta para reflejar sus intenciones.

— whuber

55

-1 porque comienzas diciendo "La respuesta es NO". y luego proceda a dar un ejemplo que responda efectivamente Sí (se da otro ejemplo en la respuesta de kjetilbhalvorsen que usted menciona favorablemente). Esto no tiene sentido para mi. Creo que las matemáticas aquí son claras para todos nosotros, así que mi voto negativo es solo por la falta de coherencia en la presentación.

— ameba dice Reinstate Monica

3

Carl, hay una gran inconsistencia entre la pregunta y los comentarios de Hard Core. La pregunta es explícita: "proporcionar un ejemplo donde dos [variables] aleatorias de la misma familia de distribución están estandarizadas pero eso no resulta en ... Variables aleatorias [s] con la misma distribución". Obviamente se pretende algún significado de "familia". El significado habitual es claro, a pesar de que existen varias variantes técnicas, y la respuesta correcta (fácilmente demostrable) es "sí, hay muchos ejemplos de este tipo".

— whuber

44

Gracias. Claramente tienes una buena idea de lo que estás escribiendo, pero desafortunadamente tu publicación propaga bastante confusión sobre cuáles podrían ser los significados de "distribución", "forma", "forma" y "parámetro". Como un ejemplo de las sutilezas, considere una familia de distribuciones creadas por cualquier ley de distribución que tenga un tercer momento central distinto de cero. La familia está indexada por dos números reales y consta de todas las leyes . Es una familia de escala de ubicación, pero las formas de estas leyes difieren según el signo de .

F

$F$

(μ, σ \neq 0)

$(\mu,\sigma\ne 0)$

x \to F (σ x + μ)

$x\to F(\sigma x+\mu)$

σ

$\sigma$

— whuber

17

Si desea un ejemplo que sea una "familia de distribución parametrizada oficialmente nombrada, puede consultar la distribución gamma generalizada, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Esta familia de distribución tiene tres parámetros, por lo que puede fijar la media y varianza y todavía tienen libertad para variar momentos superiores. Desde la página wiki, el álgebra no parece atractivo, preferiría hacerlo numéricamente. Para aplicaciones estadísticas, busque gamlss en este sitio, que es una extensión de gam (aditivo generalizado modelos, en sí mismos una generalización de glm's) que tienen parámetros para "ubicación, escala y forma".

Otro ejemplo son las distribuciones , extendidas para ser una familia de escala de ubicación. Luego, el tercer parámetro serán los grados de libertad, que desconfiarán de la forma para una ubicación y escala fijas. $t$

— kjetil b halvorsen
fuente

1

Aunque la distribución de errores generalizada puede haber sido una mejor opción.

— Carl

2

¡¡Muchas gracias por su respuesta!! Elegí el de Carl porque era más detallado pero también estaba bien ... ¡muchas gracias!

— gioxc88

14

$\epsilon_1$ $\mathcal{N}(0,1)$ $\epsilon_2$ $t$ $\sqrt\frac{1}{3}$

X = μ + σ ϵ_{1} and Y = μ + σ ϵ_{2}

$X=\mu+\sigma\epsilon_1\qquad\text{and}\qquad Y=\mu+\sigma\epsilon_2$

$f$ $X$

\frac{1}{σ^{d}} f ({x - μ} / σ)

$\frac{1}{\sigma^d} f(\{x-\mu\}/\sigma)$

— Xi'an
fuente

gracias por la respuesta pero creo que esto no es lo que pregunté

— gioxc88

66

X

$X$

Y

$Y$

Sí, de hecho, es bastante vago, pero si lees mi pregunta, escribí que en este contexto con la familia quiero decir, por ejemplo, tanto Normal como Gamma y así sucesivamente. Hiciste un ejemplo con un estudiante normal y uno t

— gioxc88

44

Hard Core, parece confundir el nombre de una familia con su concepto . Esta respuesta es buena e ilustra muy bien el concepto. Su pregunta no pide que la solución sea una familia de escala de ubicación. Si necesita que sea uno, siempre puede tomar esta respuesta, o cualquier otra respuesta, y prolongarla a una familia de escala de ubicación al permitir traducciones arbitrarias y reescalonamientos. El punto de Xi'an sobre el número de parámetros aún se mantiene.

— whuber

d f = 3, \infty

$df=3,\infty$

d f

$df$

6

Creo que se está preguntando si dos variables aleatorias que provienen de la misma familia de escala de ubicación pueden tener la misma media y varianza, pero al menos un momento superior diferente. La respuesta es no.

$X_1$ $X_2$ $X_1$ $X_2$ $X$ $a_1>0, a_2>0, b_1, b_2$ $X_1 \stackrel{d}{=} a_1 X + b_1$ $X_2 \stackrel{d}{=} a_2 X + b_2$ $X_1$ $X_2$

$E[X_1] = E[X_2] \implies a_1 E[X] + b_1 = a_2 E[X] + b_2$
$\operatorname{Var}[X_1] = \operatorname{Var}[X_2] \implies a_1^2 \operatorname{Var}[X] = a_2^2 \operatorname{Var}[X]$

$\operatorname{Var}[X] = 0$ $X_1=E[X_1]=X_2=E[X_2]$ $1$ $X_1$ $X_2$ $\operatorname{Var}[X] \neq 0$ $|a_1|=|a_2|$ $a_1>0$ $a_2>0$ $a_1=a_2$ $b_1=b_2$

E [X_{1}^{k}] = E [(a_{1} X + b_{1})^{k}] = E [(a_{2} X + b_{2})^{k}] = E [X_{2}^{k}],

$E[X_1^k] = E[(a_1X+b_1)^k] = E[(a_2X+b_2)^k] = E[X_2^k],$

k

$k$

X_{1}

$X_1$

X_{2}

$X_2$

— yyzz
fuente

1

(+1) No puedo encontrar fallas en esta respuesta. Aparentemente alguien lo hace, y también encuentran fallas en la mía. No entiendo este comportamiento inexplicable.

— Carl

55

@Carl Esta respuesta es incorrecta, por eso se está votando negativamente. Xi'an ya ha proporcionado un contraejemplo.

— whuber

1

@whuber Por favor vea mis comentarios bajo la respuesta de Xi'an. No estoy de acuerdo con él, pero no voté en contra porque tanto él como usted tienen derecho a su opinión, incluso si considero que es incorrecta.

— Carl

8

@Carl Después de volver a leer esta respuesta, necesito retractar mi evaluación original: esta respuesta es correcta (y +1 para eso), y es correcta porque explica claramente cómo está interpretando la pregunta original. (Específicamente, existe un concepto común pero limitado de una "familia de escala de ubicación" que consiste en una sola distribución estándar junto con todos sus traductores y rescataciones positivas). Creo que la pregunta original tenía la intención de hacer algo un poco diferente; La base de esa creencia es la referencia a más de dos parámetros en la publicación.

— whuber

2

Lo siento si no he sido muy claro y le agradezco el tiempo que dedicó a investigar esto, pero eso no fue lo que le pregunté.

— gioxc88

1

Como la pregunta se puede interpretar de varias formas, dividiré esta respuesta en dos partes.

A: familias de distribución.
B: familias de distribución a escala de ubicación.

El problema con el caso A puede ser respondido / demostrado fácilmente por muchas familias con un parámetro de forma.

$\mathbb{R}$ $\mathbb{R_{>0}}$

R: ¿Pueden dos distribuciones diferentes de la misma familia de distribución de 2 parámetros tener la misma media y varianza?

La respuesta es sí y ya se puede mostrar usando uno de los ejemplos mencionados explícitamente: la distribución Gamma normalizada

Familia de distribuciones gamma normalizadas.

$Z = \frac{X-\mu}{\sigma}$ $X$ $Z$

F_{Z} (z; k) = {\begin{cases} 0 & if & z < - \sqrt{k} \\ \frac{1}{Γ (k)} γ (k, z \sqrt{k} + k) & if & z \geq - \sqrt{k} \end{cases}

$F_Z(z;k) = \begin{cases} 0 & \quad \text{if} & z < -\sqrt{k}\\ \frac{1}{\Gamma(k)} \gamma(k, {z\sqrt{k}+k}) & \quad \text{if} & z \geq -\sqrt{k} \end{cases}$

$\gamma$

$Z_1$ $Z_2$ $\mu=0$ $\sigma=1$ $k$

B: ¿Pueden dos distribuciones diferentes de la misma familia de distribución de escala de ubicación de 2 parámetros tener la misma media y varianza?

Creo que la respuesta es no si consideramos solo familias suaves (suave: un pequeño cambio en los parámetros dará como resultado un pequeño cambio en la distribución / función / curva). Pero esa respuesta no es tan trivial y cuando usaríamos familias más generales (no uniformes), podemos decir que sí , aunque estas familias solo existen en teoría y no tienen relevancia práctica.

Generar una familia de escala de ubicación a partir de una única distribución por traducción y escalado

$f(x)$

f (x; μ, σ) = \frac{1}{σ} f (\frac{x - μ}{σ})

$f(x;\mu,\sigma) = \frac{1}{\sigma}f(\frac{x-\mu}{\sigma})$

Para una familia de escala de ubicación que se puede generar de esta manera, tenemos:

$f(x;\mu_1,\sigma_1)$ $f(x;\mu_2,\sigma_2)$ $f(x;\mu_1,\sigma_1) = f(x;\mu_2,\sigma_2)$

¿Se pueden generar distribuciones de miembros para las dos familias de escala de ubicación de parámetros a partir de una distribución de miembro único mediante traducción y escalado?

$\theta_1$ $\theta_2$ $\mu$ $\sigma$

Para familias particulares de dos parámetros de escala de ubicación, como la familia de distribuciones normales, no es demasiado difícil demostrar que se pueden generar de acuerdo con el proceso anterior (escalado y traducción de un solo miembro de ejemplo).

Uno puede preguntarse si es posible que cada familia de escala de ubicación de dos parámetros se genere a partir de un solo miembro mediante traducción y escalado. O una declaración en conflicto: "¿Puede una familia de dos parámetros de escala de ubicación contener dos distribuciones de miembros diferentes con la misma media y varianza?", Para lo cual sería necesario que la familia sea una unión de múltiples subfamilias que se generan por traducción y escalada.

Caso 1: Familia de distribuciones t de estudiantes generalizadas, parametrizadas por dos variables

$R^2$ $R^3$ $\theta_1$ $\theta_2$

Usemos la distribución t de Student generalizada (tres parámetros):

$f(x;\nu,\mu,\sigma) = \frac{\Gamma \left( \frac{\nu + 1}{2} \right) }{\Gamma \left( \frac{\nu}{2} \right) \sqrt{\pi\nu}\sigma} \left(1 + \frac{1}{\nu} \left( \frac{x-\mu}{\sigma} \right)^2 \right)^{-\frac{\nu+1}{2}}$

\begin{array}{rcl} μ & = & \tan (θ_{1}) \\ σ & = & θ_{2} \\ ν & = & ⌊ 0.5 + θ_{1} / π ⌋ \end{array}

$\begin{array}{rcl} \mu &=& \tan (\theta_1)\\ \sigma &=& \theta_2\\ \nu &=& \lfloor 0.5+\theta_1/\pi \rfloor \end{array}$

entonces nosotros tenemos

$f(x;\theta_1,\theta_2) = \frac{\Gamma \left( \frac{\lfloor 0.5+\theta_1/\pi \rfloor + 1}{2} \right) }{\Gamma \left( \frac{\lfloor 0.5+\theta_1/\pi \rfloor}{2} \right) \sqrt{\pi\lfloor 0.5+\theta_1/\pi \rfloor}\theta_2} \left(1 + \frac{1}{\lfloor 0.5+\theta_1/\pi \rfloor} \left( \frac{x-\tan(\theta_1)}{\theta_2} \right)^2 \right)^{-\frac{\lfloor 0.5+\theta_1/\pi \rfloor+1}{2}}$

que puede considerarse una familia de escala de ubicación de dos parámetros (aunque no muy útil) que no puede generarse mediante la traducción y el escalado de un solo miembro.

Caso 2: familias de escala de ubicación generadas por escalado negativo de una distribución única con sesgo distinto de cero

$x \mapsto f(x/b + a)$ $b$

Familias lisas

$f:\mathbb{R}^2 \mapsto \mathbb{R}^3$ funciones continuas que harían el trabajo como curvas de Peano).

$\theta_1$ $\theta_2$ $\theta_1$ $\theta_2$ $\mu$ $\sigma$

\begin{array}{rcl} θ_{1} & = & f_{θ_{1}} (μ, σ) \\ θ_{2} & = & f_{θ_{2}} (μ, σ) \end{array}

$\begin{array}{rcl} \theta_1 &= &f_{\theta_1}(\mu,\sigma) \\ \theta_2 &=& f_{\theta_2}(\mu,\sigma)\end{array}$

$f_{\theta_1}(\mu,\sigma)$ $\mu$ $\sigma$

$\theta_1$ $\theta_1$ $f(x;\theta_1)$ $x$

— Sexto empírico
fuente

1

$x$

f,

$f,$

b \neq 1

$b\ne 1$

f

$f$

θ

$\theta$

R^{2}

$R^2$

R^{3} .

$R^3.$ "El problema con estos" mapas "es que no pueden ser continuos y no tendrán un significado estadístico"

— whuber

2

R^{2} \to R^{3}

$R^2\to R^3$

θ

$\theta$

θ

$\theta$

1

La segunda viñeta es incorrecta: ni se deriva de ninguno de los supuestos ni es parte de la definición de una familia de escala de ubicación.

— Whuber

1

θ_{i}

$\theta_i$

θ_{i}

$\theta_i$

x \to F (b x + a)

$x \to F(bx + a)$

F

$F$

(a, b) \in R^{2}

$(a,b)\in\mathbb{R}^2$

b > 0

$b\gt 0$

F

$F$

1

μ

$\mu$

σ

$\sigma$

θ_{1}

$\theta_1$

θ_{2}

$\theta_2$

μ

$\mu$

σ

$\sigma$