¿Las diferencias entre números distribuidos uniformemente están distribuidas uniformemente?

22

Lanzamos un dado de 6 lados muchas veces.

Calculando la diferencia (valor absoluto) entre un rollo y su rollo anterior, ¿se espera que las diferencias se distribuyan uniformemente?

Para ilustrar con 10 rollos:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

¿ diffSe distribuirían los valores de manera uniforme?

distributions uniform

— Hola judeo
fuente

13

Trazar un histograma para al menos tener sentido

— gunes

2

Echa un vistazo a la distribución de Poisson .

— Leftaroundabout

Esto parece tarea ...

— Manu H

@Manu H, te aseguro que los días de tarea han

— quedado

37

No, no es uniforme

Puede contar las posibilidades igualmente probables para las diferencias absolutas $36$

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

lo que da una distribución de probabilidad para las diferencias absolutas de

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

— Enrique
fuente

27

@onurcanbektas La tabla en esta respuesta claramente contradice su afirmación: por ejemplo, muestra que solo una de las posibles diferencias es 5, mientras que 6 de ellas son 0. Dado que las 36 posibilidades son igualmente probables, eso no es uniforme.

— Whuber

13

@onurcanbektas Te invito una vez más a contemplar la mesa. Dado que solo tiene dos diferencias absolutas de 5, ¿no es obvio que no más de dos diferencias pueden ser iguales a 5?

— Whuber

14

@onurcanbektas Para diferencias simples (es decir, con signos, por lo tanto, enteros desde -5 hasta +5), la distribución es una distribución triangular discreta simétrica con el modo (valor más probable) en 0. Para diferencias absolutas como se muestra en mi respuesta, el el modo es 1.

— Henry

2

Sin embargo, vale la pena señalar que el módulo de diferencia con signo 6 se distribuye uniformemente.

— Federico Poloni

2

@FedericoPoloni ¿No es esto trivialmente obvio? Quiero decir, nunca lo pensé antes de leer el comentario, pero es bastante obvio que esto simplemente tiene que ser cierto

— Cruncher

21

Usando solo los axiomas más básicos sobre probabilidades y números reales, se puede demostrar una afirmación mucho más fuerte:

La diferencia de cualquiera de los dos valores aleatorios independientes no distribuidos idénticamente $X-Y$ nunca tiene una distribución uniforme discreta.

(Una declaración análoga para variables continuas se prueba en PDF uniforme de la diferencia de dos rv .)

La idea es que la posibilidad de que $X-Y$ sea un valor extremo debe ser menor que la posibilidad de que $X-Y$ sea cero, porque solo hay una forma de (por ejemplo) maximizar $X-Y$ mientras que hay muchas maneras de hacer que la diferencia sea cero , porque $X$ e $Y$ tienen la misma distribución y, por lo tanto, pueden ser iguales entre sí. Aquí están los detalles.

Primero, observe que las dos variables hipotéticas $X$ e $Y$ en cuestión solo pueden alcanzar un número finito $n$ de valores con probabilidad positiva, porque habrá al menos $n$ diferencias distintas y una distribución uniforme les asigna a todos la misma probabilidad. Si $n$ es infinito, entonces también lo sería el número de posibles diferencias con probabilidad positiva igual, de donde la suma de sus posibilidades sería infinita, lo cual es imposible.

$Y$ $m$ $q = \Pr(Y=m)$ $X$ $M$ $p = \Pr(X=M).$ $X$ $Y$

\begin{matrix} (*) & Pr (X - Y = M - m) = Pr (X = M) Pr (Y = m) = p q > 0. \end{matrix}

$\Pr(X-Y = M - m) = \Pr(X=M)\Pr(Y=m) = pq \gt 0.\tag{*}$

Finalmente , debido a y tienen la misma distribución, hay muchas maneras de sus diferencias pueden producir el valor Entre estas formas son los casos en los que y Debido a que esta distribución no es constante, difiere de Eso muestra que esos dos casos son eventos disjuntos y, por lo tanto, deben contribuir al menos una cantidad a la posibilidad de que sea cero; es decir, $X$ $Y$ $0.$ $X=Y=m$ $X=Y=M.$ $m$ $M.$ $p^2 + q^2$ $X-Y$

Pr (X - Y = 0) \geq Pr (X = Y = m) + Pr (X = Y = M) = p^{2} + q^{2} .

$\Pr(X-Y=0) \ge \Pr(X=Y=m) + \Pr(X=Y=M) = p^2 + q^2.$

Como los cuadrados de los números no son negativos, donde deducimos de que $0 \le (p-q)^2,$ $(*)$

Pr (X - Y = M - m) = p q \leq p q + (p - q)^{2} = p^{2} + q^{2} - p q < p^{2} + q^{2} \leq Pr (X - Y = 0),

$\Pr(X-Y=M-m)=pq \le pq + (p-q)^2 = p^2 + q^2 - pq \lt p^2 + q^2 \le \Pr(X-Y=0),$

mostrando la distribución de no es uniforme, QED. $X-Y$

Editar en respuesta a un comentario

Un análisis similar de las diferencias absolutasobserva que debido a que e tienen la misma distribución,Esto requiere que estudiemosLa misma técnica algebraica produce casi el mismo resultado, pero existe la posibilidad de que yEse sistema de ecuaciones tiene la solución única $|X-Y|$ $X$ $Y$ $m=-M.$ $\Pr(X-Y=|M-m|) = 2pq.$ $2pq=2pq+(p-q)^2$ $2pq+p^2+q^2=1.$ $p=q=1/2$ correspondiente a una moneda justa (un "dado de dos caras"). Además de esta excepción, el resultado para las diferencias absolutas es el mismo que para las diferencias, y por las mismas razones subyacentes ya dadas: a saber, las diferencias absolutas de dos variables aleatorias iid no pueden distribuirse uniformemente cuando hay más de dos diferencias distintas con probabilidad positiva

(fin de la edición)

Apliquemos este resultado a la pregunta, que pregunta sobre algo un poco más complejo.

Modele cada tirada independiente del dado (que podría ser un dado injusto ) con una variable aleatoria Las diferencias observadas en estos rollos son los números Podríamos preguntarnos qué tan uniformemente distribuidos están estos números . Esa es realmente una pregunta sobre las expectativas estadísticas: ¿cuál es el número esperado de que es igual a cero, por ejemplo? ¿Cuál es el número esperado de igual a ? Etcétera etcétera. $X_i,$ $i=1, 2, \ldots, n.$ $n$ $\Delta X_i = X_{i+1}-X_i.$ $n-1$ $\Delta X_i$ $\Delta X_i$ $-1$

El aspecto problemático de esta pregunta es que no son independientes: por ejemplo, y involucran el mismo rollo $\Delta X_i$ $\Delta X_1 = X_2-X_1$ $\Delta X_2 = X_3 - X_2$ $X_2.$

Sin embargo, esto no es realmente una dificultad. Como la expectativa estadística es aditiva y todas las diferencias tienen la misma distribución, si seleccionamos cualquier valor posible de las diferencias, el número esperado de veces que la diferencia es igual a en toda la secuencia de rollos es solo veces el número esperado de veces la diferencia es igual a en un solo paso del proceso. Esa expectativa de un solo paso es (para cualquier ). Estas expectativas serán las mismas para todas las (es decir, uniformes ) si y solo si son las mismas para un solo $k$ $k$ $n$ $n-1$ $k$ $\Pr(\Delta X_i = k)$ $i$ $k$ $\Delta X_i.$ Pero hemos visto que no tiene una distribución uniforme, incluso cuando el dado puede estar sesgado. Por lo tanto, incluso en este sentido más débil de las frecuencias esperadas, las diferencias de los rodillos no son uniformes. $\Delta X_i$

— whuber
fuente

@Michael Buen punto: respondí la pregunta como se le preguntó (que se trata de "diferencias"), en lugar de como se ilustra (que claramente se refiere a diferencias absolutas). Se aplica la misma técnica: solo hay que tener en cuenta las diferencias máximas y mínimas. En el caso de que esas sean las únicas dos posibilidades (junto con cero), podemos obtener la igualdad, que es de donde proviene el resultado de Bernoulli (mostrando que es el único ejemplo de este tipo).

(1 / 2)

$(1/2)$

— Whuber

Otra respuesta que prueba una versión particular de esto está aquí .

— Restablece a Mónica el

Gracias, @Ben: había olvidado ese hilo. Debido a que es una mejor referencia, ahora enlazo directamente a ella en esta respuesta.

— Whuber

12

En un nivel intuitivo, un evento aleatorio solo puede distribuirse uniformemente si todos sus resultados son igualmente probables.

¿Es así para el evento aleatorio en cuestión: diferencia absoluta entre dos tiradas de dados?

En este caso, es suficiente mirar los extremos: ¿cuáles son los valores más grandes y más pequeños que podría tomar esta diferencia?

Obviamente 0 es el más pequeño (estamos viendo diferencias absolutas y las tiradas pueden ser las mismas), y 5 es el más grande ( 6vs 1).

Podemos mostrar que el evento no es uniforme al mostrar que 0es más (o menos) probable que ocurra que 5.

De un vistazo, solo hay dos formas de que ocurra 5: si el primer dado es 6 y el segundo 1, o viceversa . ¿De cuántas maneras puede ocurrir 0?

— MichaelChirico
fuente

1

+1 Creo que esto llega al meollo del asunto. He publicado una generalización de la pregunta que finalmente se basa en la misma observación.

— Whuber

5

Según lo presentado por Henry, las diferencias de distribuciones distribuidas uniformemente no están distribuidas uniformemente.

Para ilustrar esto con datos simulados, podemos usar un script R muy simple:

barplot(table(sample(x=1:6, size=10000, replace=T)))

Vemos que esto produce de hecho una distribución uniforme. Veamos ahora la distribución de las diferencias absolutas de dos muestras aleatorias de esta distribución.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

— LuckyPal
fuente

66

¿Por qué esto tiene algo que ver con el CLT, que se refiere a la distribución asintótica de las medias de un gran número de valores iid?

— Whuber

2

Me gusta la conexión que originalmente hiciste con CLT . Sea el número de muestras que se agregarán (o restarán) de la distribución uniforme original. CLT implica que para grande la distribución tenderá a ser normal. Esto a su vez implica que la distribución no puede permanecer uniforme para cualquier , como que es lo que está pidiendo OP. (Si esto no es auto-explicativo, considere que si la suma se distribuye uniformemente cuando , reindexar implicaría que también es uniforme cuando , etc, incluso para grandes .)

n

$n$

n

$n$

n > 1

$n>1$

n = 2

$n=2$

n = 2

$n=2$

n = 4

$n=4$

n

$n$

— krubo

3

@Krubo La pregunta original se refiere a la distribución de las diferencias entre las tiradas sucesivas de un dado. El CLT no tiene nada que decir al respecto. De hecho, no importa cuántas veces se lance el dado, la distribución de esas diferencias no se acercará a la normalidad.

— whuber

¿Esta distribución tiende a ser uniforme ya que el número de caras de troquel tiende a infinito? No estoy seguro de cómo hacer para mostrar eso, pero intuitivamente parece que se dirige en esa dirección, pero no sé si se "bloquea" asintóticamente en algún lugar antes de aplanarse lo suficiente

— Cruncher

@Cruncher puede cambiar fácilmente el número de caras de troquel en el código R. Cuantas más caras haya, más evidente será la naturaleza de las escaleras de la distribución. '1' es siempre el pico de esa escalera y con mayores diferencias las probabilidades se aproximan a cero. Además, la diferencia de '0' es claramente más rara que '1'. (al menos si el valor más pequeño del dado es '1')

— LuckyPal

2

Otros han trabajado los cálculos, le daré una respuesta que me parece más intuitiva. Desea estudiar la suma de dos unifrom rv (Z = X + (-Y)), la distribución general es el producto de convolución (discreto):

P (Z = z) = \sum_{k = - \infty}^{\infty} P (X = k) P (- Y = z - k)

$P(Z=z) = \sum^{\infty}_{k=-\infty} P(X=k) P(-Y = z-k)$

Esta suma es bastante intuitiva: la probabilidad de obtener , es la suma de las probabilidades de obtener algo con X (anotado aquí) y el complemento de con -Y. $z$ $k$ $z$

Por el procesamiento de la señal, sabemos cómo se comporta el producto de convolución:

El producto de convolución de dos funciones uniformes (dos rectángulos) dará un triángulo. Esto es ilustrado por wikipedia para funciones continuas:

Puede comprender lo que sucede aquí: a medida que mueve hacia arriba (la línea de puntos vertical), el dominio común de ambos rectángulos se mueve hacia arriba y hacia abajo, lo que corresponde a la probabilidad de obtener . $z$ $z$
En términos más generales, sabemos que las únicas funciones que son estables por convolución son las de la familia gaussiana. es decir, solo la distribución gaussiana es estable por adición (o más generalmente, combinación lineal). Esto también significa que no se obtiene una distribución uniforme cuando se combinan distribuciones uniformes.

En cuanto a por qué obtenemos esos resultados, la respuesta radica en la descomposición de Fourrier de esas funciones. La transformación de Fourrier de un producto de convolución es el producto simple de las transformaciones de Fourrier de cada función. Esto proporciona enlaces directos entre los coeficientes de cuatro niveles de las funciones de rectángulo y triángulo.

— lcrmorin
fuente

Verifique la validez de sus reclamos y la lógica de su respuesta. La pregunta no es si la convolución de dos distribuciones uniformes es uniforme: es si la convolución de alguna distribución y su inversión pueden ser uniformes. Y hay muchas más familias distribuidoras que las gaussianas que son estables bajo convolución (estandarización de módulos, por supuesto): ver en.wikipedia.org/wiki/Stable_distribution

— whuber

Tienes razón sobre las distribuciones estables. Para la pregunta, estoy bastante seguro de que se trata de la diferencia de dos valores aleatorios con distribución uniforme (como lo indica el título). La pregunta de si la convolución de alguna distribución y su inversión puede ser uniforme es mayor que la que se pregunta aquí.

— lcrmorin

1

Si e son dos tiradas de dados consecutivas, puede visualizar (para ) de la siguiente manera donde cada color corresponde a un valor diferente de : $x$ $y$ $|x-y| = k$ $k = 0, 1, 2, 3, 4, 5$ $k$

Como puede ver fácilmente, el número de puntos para cada color no es el mismo; por lo tanto, las diferencias no están distribuidas uniformemente.

— hoy
fuente

0

Supongamos que denota la diferencia y el valor del rollo, luego $D_t$ $X$ $P(D_t = 5) = P(X_t = 6, X_{t-1} = 1) < P((X_t, X_{t-1}) \in \{(6, 3), (5, 2)\}) < P(D_t = 3)$

Entonces la función no es constante en . Esto significa que la distribución no es uniforme. $P(D_t = d)$ $d$

— Hunaphu
fuente