Óptima clasificación aleatoria de comparación


12

¡Entonces todos conocemos el límite inferior del árbol de comparación de en el peor de los casos de comparaciones realizadas por un algoritmo de clasificación de comparación (determinista). No se aplica a la clasificación de comparación aleatoria (si medimos las comparaciones esperadas para el peor de los casos). Por ejemplo, para n = 4 , el límite inferior determinista es de cinco comparaciones, pero un algoritmo aleatorio (permutar aleatoriamente la entrada y luego aplicar el orden de fusión) funciona mejor, teniendo 4 2log2n!n=4 comparaciones en expectativa para todas las entradas.423

El enlazado sin los límites máximos todavía se aplica en el caso aleatorio, por un argumento teórico de la información, y puede ajustarse ligeramente a k + 2 ( n ! - 2 k )log2n! Esto se debe a que hay un algoritmo óptimo que permuta aleatoriamente la entrada y luego aplica un árbol de decisión (determinista), y el mejor árbol de decisión (si existe) es uno en el que todas las hojas están en dos niveles consecutivos.

k+2(n!2k)n!, where k=log2n!.

¿Qué pasa si se sabe algo sobre los límites superiores de este problema? Para todos , el número aleatorio de comparaciones (en espera, para la entrada del peor de los casos, para el mejor algoritmo posible) siempre es estrictamente mejor que el mejor algoritmo determinista (esencialmente, porque n ! Nunca es una potencia de dos) . Pero cuanto mejor?n>2n!


lg(n!)+o(n)

Respuestas:


4

Ya que su pregunta es: "¿Qué se sabe?" Aquí hay algo:

http://arxiv.org/abs/1307.3033

logn!+cnc


nlogn1.415nnlogn1.399n

No soy un experto, la única razón por la que sé algo de esto es John Iacono. Sin embargo, creo que tiene que ver con las fluctuaciones basadas en qué tan cerca está n (4/3 veces) de una potencia de 2. Si observa el análisis en la página 71 aquí, link.springer.com/content/pdf /10.1007%2FBF01934989.pdf , el límite -1.415n parece mantenerse solo cuando n = floor ((4/3) 2 ^ k) para algún entero k. ¿Quizás el -1.329n atado en Knuth es el mejor que tiene para todos los n?
Pat Morin

Definitivamente hay fluctuaciones, pero pensé que (4/3) 2 ^ k era el peor de los casos y era mejor para otros casos.
David Eppstein
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.