Recientemente me enteré de la conjetura codiciosa para el problema de la supercuerda más corta .
En este problema, se nos da un conjunto de cadenas queremos encontrar la súper cadena más corta, decir, cada aparece como una subcadena de .
Este problema es NP-hard y después de una larga secuencia de documentos, el algoritmo de aproximación más conocido para este problema tiene una relación [Paluch '14].
En la práctica, los biólogos usan el siguiente algoritmo de Greedy:
En cada paso, combine dos cadenas que tengan una superposición máxima sobre todos los pares (el sufijo máximo que es el prefijo de otra cadena) y repita en esta nueva instancia hasta que solo quede una cadena (que es una supercadena de todas las cadenas de entrada )
Se puede obtener un límite inferior de en la relación de aproximación de este Algoritmo codicioso a partir de la entrada .
Curiosamente, se conjeturó que este es el peor ejemplo, es decir, que Greedy logra una aproximación de para el problema de la supercuerda más corta. Me sorprendió mucho ver que un algoritmo tan natural y fácil es tan difícil de analizar.
¿Hay intuiciones, hechos, observaciones, ejemplos que sugieran por qué esta pregunta es tan desafiante?