Resolviendo Superestring Exactamente

¿Qué se sabe sobre la complejidad exacta del problema de supercuerdas más corto? ¿Se puede resolver más rápido que $O^*(2^n)$ ? ¿Existen algoritmos conocidos que resuelvan la supercadena más corta sin reducir a TSP?

UPD: suprime los factores polinomiales. $O^*(\cdot)$

El problema de la supercuerda más corta es un problema cuya respuesta es la cadena más corta que contiene cada cadena de un conjunto dado de cadenas. La pregunta es acerca de la extensión de optimización de un famoso problema NP-duro La Superstring más corta (Garey y Johnson, p.228).

— Alex Golovnev
fuente

¿Qué es "el problema de la supercuerda"?

— Jeffε

Me refería al problema de la supercuerda más corta, lo arreglé. ¡Gracias!

— Alex Golovnev

Bien, entonces, ¿cuál es "el problema de supercuerdas más corto"? Puedo pensar en varios problemas que merecen ese nombre, y algunos más que deberían llamarse "el problema de supersecuencia más corto " pero que probablemente no están en la práctica. ¡Danos un poco de contexto, por favor!

— Jeff el

¿Cuál es tu área problemática? por ejemplo, si busca la supercadena más corta en la fragmentación del genoma, debido a que la fragmentación del genoma crea gráficos de ancho de árbol acotado, puede tener un algoritmo rápido, pero si solo le interesan los algoritmos más rápidos que los disponibles, su respuesta es no, excepto que puede tener un algoritmo más rápido en TSP (debido a una reducción simple), también hay

algoritmo en gráficos de ancho de árbol delimitados localmente.

O^{*} (2^{\sqrt{n}})

$O^*(2^{\sqrt n})$

— Saeed

@AlexGolovnev, Sí, tienes razón, esto es ATSP, pero para el ancho de árbol acotado creo que es bueno ver cs.bme.hu/~dmarx/papers/marx-warsaw-fpt2 o si quieres saber más sobre ellos también es bueno ver algoritmo meta teorema

— Saeed

Respuestas:

Suponiendo que las cadenas tienen una longitud de polinomio en , entonces sí, hay al menos un $n$ solución de tiempo. La razón es la reducción bien conocida del problema de supercuerda común más corto a ATSP con pesos enteros de tamaño polinómico, que a su vez puede resolver mediante interpolación polinómica si puede contar los ciclos de Hamilton en un multigrafo dirigido. El último problema tiene un $2^{n-\Omega(\sqrt{n/\log n})}$ solución de tiempo. Björklund 2012 $2^{n-\Omega(\sqrt{n/\log n})}$

La reducción de ATSP con los pesos para cada par de vértices para conteo ciclo de Hamilton va como sigue: $w_{uv}$ $u,v$

Para , donde es un límite superior en todas las sumas de pesos en la instancia ATSP, construya un gráfico donde reemplace cada peso con arcos de a . $r=1,2,\cdots,w_\mbox{sum}$ $w_\mbox{sum}$ $n$ $G_r$ $w_{uv}$ $r^{w_{uv}}$ $u$ $v$

Al resolver el conteo del ciclo hamiltoniano para cada , usted puede, mediante interpolación polinómica, construir un polinomio con igual al número de recorridos TSP en el gráfico original de peso . Por lo tanto, localizar el más pequeño de modo que no sea cero resuelve el problema. $G_r$ $\sum_{l=0}^{w_\mbox{sum}} a_lr^l$ $a_l$ $l$ $l$ $a_l$

— Andreas Björklund
fuente

¡Muchas gracias! No conocía esta conexión con el conteo del ciclo hamiltoniano.

— Alex Golovnev

@AlexGolovnev: ¿Pero la reducción es más o menos la misma que, por ejemplo, en el resultado de Kohn, Gottlieb, Kohn que citó en su propia respuesta? Es una incrustación simple de la suma de min-sum en los enteros. De todos modos, gracias por hacerme darme cuenta de que la próxima versión de mi artículo debería indicar esto explícitamente.

— Andreas Björklund

He estudiado el problema y encontré algunos resultados. La Superstring común más corta (SCS) puede resolverse en el tiempo con solo espacio polinomial ( Kohn, Gottlieb, Kohn ; Karp ; Bax, Franklin ). $2^n$

La aproximación más conocida es (paluch). $2\frac{11}{30}$

La aproximación de compresión más conocida es (Paluch). $3\over4$

Si SCS puede aproximarse por un factor sobre el alfabeto binario, entonces puede aproximarse por un factor sobre cualquier alfabeto ( Vassilevska-Williams ). $\alpha$ $\alpha$

SCS no se puede aproximar con una relación mejor que menos que P = NP ( Karpinski, Schmied ). $1.0029$

La compresión máxima no se puede aproximar con una relación mejor que menos que P = NP ( Karpinski, Schmied ). $1.0048$

Agradecería cualquier adición y sugerencia.

— Alex Golovnev
fuente

Aquí está el problema de la supercadena más corta: se le dan cadenas sobre algún alfabeto y desea encontrar la cadena más corta sobre que contiene cada como una subsecuencia de caracteres consecutivos, es decir, una subcadena. $n$ $s_1,\ldots, s_n$ $\Sigma$ $\Sigma$ $s_i$

Cuando hablamos de algoritmos exactos para el problema, encontrar la longitud de la supercadena más corta es equivalente a encontrar la compresión máxima que es la suma de todas las superposiciones de cadenas consecutivas en la supercadena final, es decir, . $L$ $C$ $C=\sum_i |s_i|-L$

Hasta donde yo sé, el algoritmo exacto más rápido para las supercuerdas más cortas se ejecuta en ( ) donde es el número de cadenas. Este es un algoritmo de programación dinámica simple similar al algoritmo de programación dinámica para la ruta más larga (y otros problemas): $O^*$ $2^n$ $n$

Para cada subconjunto de cadenas y cadena en calculamos la compresión máxima sobre todas las supercadenas sobre donde es la primera cadena que aparece en la supercadena, almacenando esto como C (( )). Hacemos esto procesando primero todos los subconjuntos con un solo elemento, y luego acumulando los valores de C (( )) para los subconjuntos en las cadenas de aquellos en las cadenas . Específicamente: $S$ $v$ $S$ $S$ $v$ $v,S$ $v,S$ $S$ $k$ $k-1$

$u$ $S'$ $k-1$ $u$ $u,{u}\cup S'$ $v$ $S'$ $u$ $v$ $v,S'$

$n^2 2^n + n^2 l$ ) where $l$ is the maximum string length.

There are better algorithms if you assume that $l$ is small, or the pairwise overlaps are small, the alphabet size is small etc, but I am not aware of any algorithm that's faster than $2^n$ .

— virgi
fuente

OP knows

O^{*} (2^{n})

$O^*(2^n)$ algorithm, he asked for faster solution.

— Saeed

as I said, I don't believe a faster solution is known.

— virgi

@virgi, thank you very much! Your algorithm is very nice. But I think inclusion-exclusion principle gives us even

O^{*} (2^{n})

$O^*(2^n)$ -algorithm with polynomial space for the Superstring problem. I'm really interesting in faster algorithms, may be with some constraints (small alphabet, short answer etc). Thank you very much!

— Alex Golovnev