Probabilidad de que funcione una red de clasificación aleatoria

Dadas entradas , construimos una red de clasificación aleatoria con puertas seleccionando iterativamente dos variables con y agregando una puerta de comparación que las intercambia si . $n$ $x_0, \ldots, x_{n-1}$ $m$ $x_i, x_j$ $i < j$ $x_i > x_j$

Pregunta 1 : Para fijo , ¿qué tan grande debe ser para que la red se ordene correctamente con probabilidad ? $n$ $m$ $> \frac{1}{2}$

Tenemos al menos el límite inferior ya que una entrada que está correctamente ordenada, excepto que cada par consecutivo se intercambia tomará tiempo para cada par para ser elegido como comparador. ¿Es ese también el límite superior, posiblemente con más factores ? $m = \Omega(n^2 \log n)$ $\Theta(n^2 \log n^2)$ $\log n$

Pregunta 2 : ¿Existe una distribución de compuertas de comparación que logre , quizás eligiendo comparadores cercanos con mayor probabilidad? $m = \tilde{O}(n)$

sorting-network

— Geoffrey Irving
fuente

Supongo que uno puede obtener un límite superior mirando una entrada a la vez y luego un límite de unión, pero eso suena lejos de ser ajustado.

O (n^{3} l o g^{O (1)})

$O(n^3log^{O(1)})$

— daniello

Idea para la pregunta 2: elija una red de clasificación de profundidad . En cada paso, elija aleatoriamente una de las puertas de la red de clasificación y realice esa comparación. Después de los pasos , se habrán aplicado todas las puertas de la primera capa. Después de otros pasos , se habrán aplicado todas las puertas en la segunda capa. Si puede demostrar que esto es monótono (insertar comparaciones adicionales en el medio de la red de clasificación no puede dañar), habrá obtenido una solución con comparadores en total en promedio. Sin embargo, no estoy seguro de si la monoticidad realmente es válida.

O (\log^{2} n)

$O(\log^2 n)$

\tilde{O} (n)

$\tilde{O}(n)$

\tilde{O} (n)

$\tilde{O}(n)$

\tilde{O} (n)

$\tilde{O}(n)$

— DW

@DW: La monotonicidad no necesariamente se cumple. Considere las secuencias Secuencia funciona; no (considere la entrada (1, 0, 0)). La idea es que clasifique cualquier entrada que reciba, excepto (ver aquí ). En , esa entrada no puede alcanzar . En puede.

\begin{array}{rcl} s & = & (X_{1}, X_{2}), (X_{0 0}, X_{2}), (X_{0 0}, X_{1}); \\ s^{'} & = & (X_{1}, X_{2}), (X_{0 0}, X_{1}), (X_{0 0}, X_{2}), (X_{0 0}, X_{1}) . \end{array}

$\begin{eqnarray*} s &=&(x_1, x_2), (x_0, x_2), (x_0, x_1);\\ s'&=&(x_1, x_2), \mathbf{(x_0, x_1)}, (x_0, x_2), (x_0, x_1).\end{eqnarray*}$

s

$s$

s^{'}

$s'$

(x_{0}, x_{2}), (x_{0}, x_{1})

$(x_0, x_2), (x_0, x_1)$

(0, 1, 0)

$(0, 1, 0)$

s

$s$

(x_{0}, x_{2}), (x_{0}, x_{1})

$(x_0, x_2), (x_0, x_1)$

s^{'}

$s'$

— Neal Young

Considere la variante donde se elige la red seleccionando dos variables adyacentes al azar en cada paso. Ahora se mantiene la monotonicidad (ya que los intercambios adyacentes no crean inversiones). Aplicar @ idea de DW a una red de clasificación par-impar , que tiene rondas: en las rondas impares se compara todos los pares adyacentes, donde es impar, en rondas incluso se compara todos los pares adyacentes, donde es par. Whp la red aleatoria es correcta en las comparaciones , ya que "incluye" esta red. (¿O me estoy perdiendo algo?)

x_{i}, x_{i + 1}

$x_i, x_{i+1}$

n

$n$

i

$i$

i

$i$

O (n^{2} \log n)

$O(n^2\log n)$

— Neal Young

Monotonicidad de redes adyacentes: Dado , para define . Diga si ( ). Arregle cualquier comparación " ". Deje y provienen de y al hacer esa comparación. Reclamación 1. y . Reclamación 2: si , entonces . Luego muestre inductivamente: si

a, b \in {0, 1}^{n}

$a, b\in\{0,1\}^n$

j \in {0, 1, \dots, n}

$j\in\{0,1,\ldots,n\}$

s_{j} (a) = \sum_{i = 1}^{j} a_{i}

$s_j(a) = \sum_{i=1}^j a_i$

a ⪯ b

$a\preceq b$

s_{j} (a) \leq s_{j} (b)

$s_j(a) \le s_j(b)$

\forall j

$\forall j$

x_{i} < x_{i + 1}

$x_i < x_{i+1}$

a^{'}

$a'$

b^{'}

$b'$

a

$a$

b

$b$ $a' \preceq a$ $b' \preceq b$ $a\preceq b$ $a' \preceq b'$

y

$y$ es el resultado de la secuencia de comparación en la entrada , y es el resultado de la súper secuencia de en , entonces . Entonces, si está ordenado, también lo está .

s

$s$

x

$x$

y^{'}

$y'$

s^{'}

$s'$

s

$s$

x

$x$

y^{'} ⪯ y

$y' \preceq y$

y

$y$

y^{'}

$y'$

— Neal Young

Aquí hay algunos datos empíricos para la pregunta 2, basados en la idea de DW aplicada al ordenamiento bitónico. Para variables, elija con probabilidad proporcional a , luego seleccione uniformemente al azar para obtener un comparador . Esto coincide con la distribución de los comparadores en orden bitónico si es una potencia de 2, y se aproxima de otra manera. $n$ $j - i = 2^k$ $\lg n - k$ $i$ $(i,j)$ $n$

Para una secuencia infinita dada de compuertas extraídas de esta distribución, podemos aproximar el número de compuertas requeridas para obtener una red de clasificación clasificando muchas secuencias de bits aleatorias. Aquí está esa estimación para tomando la media de más de secuencias de compuerta con secuencias de bits utilizadas para aproximar el conteo: parece coincidir con , la misma complejidad que la ordenación bitónica. Si es así, no comemos un factor adicional debido al problema del colector de cupones de cruzar cada puerta. $n < 200$ $100$ $6400$ $\Theta(n \log^2 n)$ $\log n$

Para enfatizar: estoy usando solo secuencias de bits para aproximar el número esperado de puertas, no . Las puertas medias requeridas aumentan con ese número: para si uso secuencias , y , las estimaciones son , y . Por lo tanto, es posible que las últimas secuencias aumenten la complejidad asintótica, aunque intuitivamente se siente poco probable. $6400$ $2^n$ $n = 199$ $6400$ $64000$ $640000$ $14270 \pm 1069$ $14353 \pm 1013$ $14539 \pm 965$

Editar : Aquí hay una gráfica similar hasta , pero usando el número exacto de puertas (calculado a través de una combinación de muestreo y Z3). He cambiado de potencia de dos a arbitraria con probabilidad proporcional a . todavía parece plausible. $n = 80$ $d = j-i$ $d \in [1,\frac{n}{2}]$ $\frac{\log n - \log d}{d}$ $\Theta(n \log^2 n)$

— Geoffrey Irving
fuente

Buen experimento! Sin embargo, hay una forma diferente de que surja el problema del recolector de cupones: solo está muestreando una pequeña fracción de las secuencias de bits necesarias para verificar la corrección en todas las entradas. Parece que podemos concluir (científicamente, no matemáticamente, por supuesto) de su experimento que una red aleatoria de este tipo y tamaño clasifica un whp de permutación aleatoria . También me gustaría ver pruebas exhaustivas de en redes aleatorias para todos los a los que estás dispuesto a ir. ( no debería ser tan malo, tal vez incluso dependiendo del idioma y hardware que esté usando).

2^{n}

$2^n$

2^{n}

$2^n$

n

$n$

n = 20

$n=20$

n = 30

$n=30$

— Joshua Grochow

Se ve igual para exactos hasta , pero no lo veo como concluyente.

n = 27

$n = 27$

— Geoffrey Irving

@JoshuaGrochow: he agregado valores exactos hasta .

n = 80

$n = 80$

— Geoffrey Irving

¡Agradable! Sin embargo, parece haber una extensión creciente de los datos exactos, lo que quizás indica un límite superior con un factor adicional de ? (Es decir, si el "spread" está creciendo a un ritmo de .)

\log n

$\log n$

\log n

$\log n$

— Joshua Grochow

Sí, no podemos descartar un factor adicional. Sin embargo, me sorprendería si fuera , ya que hasta 80 tenemos y, contrario, la constante es sospechosamente cercana a . En este punto creo que la teoría tiene que hacerse cargo. :)

\log n

$\log n$

\lg n \approx 6

$\lg n \approx 6$

1

$1$

— Geoffrey Irving