¿Por qué P = NP no implica P = AP (es decir, P = PSPACE)?

18

Es bien sabido que si $\mathbf{P}=\mathbf{NP}$ entonces la jerarquía polinomio colapsa y $\mathbf{P}=\mathbf{PH}$ .

Esto puede entenderse fácilmente inductivamente utilizando máquinas Oracle. La pregunta es: ¿por qué no podemos continuar el proceso inductivo más allá de un nivel constante de alternancias y demostrar $\mathbf{P}=\mathbf{AltTime}(n^{O(1)})$ (también conocido como $\mathbf{AP}=\mathbf{PSPACE}$ )?

Estoy buscando una respuesta intuitiva.

cc.complexity-theory polynomial-hierarchy intuition

— José
fuente

1

Consulte también las preguntas relacionadas cstheory.stackexchange.com/questions/2032/… y cstheory.stackexchange.com/questions/5463/…

— András Salamon

44

Se sabe que la

N L = c o N L

$\mathsf{NL} = \mathsf{coNL}$ pero se sospecha que

A L

$\mathsf{AL}$ (es decir,

P

$\mathsf{P}$ ) no es igual a

N L

$\mathsf{NL}$ .

— sdcvvc

relacionado: ¿Qué tiene de malo esta prueba de que NP = coNP implica NP = PSPACE

— Kaveh

32

La prueba para $\mathbf{P}=\mathbf{AltTime}(O(1))$ ( $=\mathbf{PH}$ ) es una inducción utilizando $\mathbf{P}=\mathbf{NP}$ . La inducción muestra que para cualquier número natural $k$ , $\mathbf{P}=\mathbf{AltTime}(k)$ (y $\mathbf{AltTime}(O(1))$ es solo su unión).

La inducción no funciona cuando el número de alternancia puede cambiar con el tamaño de entrada (es decir, cuando el número de posibles alternancias de la máquina no es un número, sino una función del tamaño de entrada, es decir, no estamos mostrando que una ejecución de la máquina en una sola entrada puede reducirse a ninguna alternancia, estamos demostrando que las ejecuciones de la máquina en todas las entradas pueden reducirse "uniformemente" a ninguna alternancia).

Veamos una declaración similar pero más simple. Queremos mostrar que la función de identidad eventualmente domina todas las funciones constantes ( iff para todas pero finitamente muchas ). Se puede demostrar por inducción. Para todo , (es decir, donde $id(n)=n$ $f \ll g$ $n$ $f(n) \leq g(n)$ $k$ $k \ll n$ $f_k \ll id$ $f_k(n)=k$ ), pero no tenemos esto para funciones no constantes como , . $n^2$ $n^2 \not \ll n$

— Kaveh
fuente

22

Compare la jerarquía polinómica con la jerarquía para pruebas interactivas. Si para alguna k fija , tiene k alternancias en una prueba interactiva - IP ( k ) - la clase de complejidad resultante no tiene más potencia que la que obtiene con dos alternancias, es decir, IP ( k ) = IP (2 ) = AM (suponiendo que k ≥2). Sin embargo, si permite un número polinómico de alternancias, obtiene la clase de complejidad IP = PSPACE, que se cree que es mucho más grande que AM, una clase está contenida en Π ₂ P, en el segundo nivel de la jerarquía polinómica. Entonces, este fenómeno realmente ocurre (aunque, hasta donde sabemos, con la jerarquía polinómica).

Esto sucede porque la reducción que toma un problema de tamaño n en IP ( k ) y lo convierte en un problema en IP (2) explota el tamaño del problema, de modo que mientras que para cualquier IP específica ( k ) el problema sigue siendo de tamaño polinómico , si deja que k varíe, la reducción resultante no genera problemas polinomiales en k .

— Peter Shor
fuente

11

Aquí hay una pequeña intuición sobre la brecha entre las alternancias constantes y sin límites: una operación polinomial repetida un número constante de veces es polinomial, pero repetir un número polinómico de veces puede ser exponencial. Por ejemplo, tome la multiplicación repetida en sí misma:

v = 2
for(i=1 to n)
  v = v*v

El número de iteraciones es lineal y la salida es exponencial. Pero si arregla n, es polinomial en el tamaño del valor inicial.

— Patey Ludovic
fuente

4

A continuación, amplío un poco el punto en la respuesta de Peter tratando de llevar a cabo la eliminación del cuantificador durante más de un número constante de pasos para ver dónde falla y si se puede salvar algo de tal intento.

Intentemos amplificar $\mathsf{P}=\mathsf{NP}$ por más de un número constante de veces.

Supongamos que $\mathsf{P}=\mathsf{NP}$ . Por lo tanto, existe una máquina del tiempo polinómica que resuelve Ext-Circuit-SAT (¿hay una extensión satisfactoria para un circuito dado y una asignación parcial a sus entradas?).

Más formalmente, tenemos un algoritmo polytime $A$ con tiempo de ejecución polinómico $p(n)\in\rm{poly}(n)$ st

Dado un circuito booleano $\varphi$ , y una asignación parcial $\tau$ a las entradas,
$A$ devuelve "sí" si hay una extensión de $\tau$ que satisface $\varphi$ , y devuelve "no" en caso contrario.

Para repasar tiempos constantes, necesitamos eliminar el cuantificador de manera efectiva. Podemos hacer esto porque el teorema de Cook-Levin es un teorema constructivo, de hecho, proporciona un algoritmo de tiempo polinómico $Cook$ st

Dado un DTM $M$ recibir dos entradas, y tres números unarios $n$ , $m$ , y $t$ ,
$Cook(M, n, m, t)$ devuelve un circuito booleano de tamaño $O(t^2)$ que simula $M$ en las entradas de longitud $(n,m)$ para $t$ pasos.

Intentemos usar estos para extender el argumento de $\mathsf{P}=\mathsf{PH}$ para obtener un algoritmo que resuelva TQBF (en realidad TQBCircuit, es decir, un problema del circuito booleano totalmente cuantificado).

La idea del algoritmo es la siguiente: usamos repetidamente $Cook$ en $A$ para eliminar los cuantificadores de un circuito cuantificado dado. Hay un número lineal de cuantificadores, por lo que esperamos obtener un algoritmo de tiempo polinómico (tenemos un algoritmo con muchos pasos polinomiales utilizando la subrutina de tiempo polinomial $Cook$ ). Al final de este proceso de eliminación del cuantificador tendremos un circuito libre de cuantificadores que se puede evaluar en tiempo polinómico (el problema del valor del circuito está en $\mathsf{P}$ , sea $CV$ un algoritmo de tiempo polinómico para calcular el valor del circuito de un circuito dado) .

Sin embargo, veremos que esta idea no funciona (por la misma razón señalada por Peter).

Sea $\varphi$ un circuito cuantificado (inicializado a la fórmula cuantificada dada).
Deje $k$ el número de cuantificadores en $\varphi$ .
Para $i$ de $k$ a $1$ do
- Deje $\psi$ = $Qx_k \sigma(x_1,...,x_k)$ sea la última cuantificador y la parte libre de cuantificador.
- Si $Q = "\exists"$ ,
  1. Calcular $C = Cook(A, |\sigma|, |x_1|+...+|x_k-1|, p)$ ,
  2. Sustituya los bits de entrada con $\sigma$ en el circuito $C$ ,
  3. Reemplace $\psi$ con $C$ en $\varphi$ .
- Si $Q = "\forall"$ ,
  1. Considere $\psi$ como $\lnot \exists x_k \lnot \sigma$ ,
  2. Calcular $C = Cook(A, |\lnot \sigma|, |x_1|+...+|x_k-1|, p)$ ,
  3. Sustituya los bits de entrada con $\lnot \sigma$ en el circuito $C$ ,
  4. Reemplace $\psi$ con $\lnot C$ en $\varphi$ .
Calcule y devuelva $CV(\varphi)$ .

El algoritmo resultante parece tiempo polinómico: tenemos muchos pasos polinómicos, cada paso es computable en tiempo polinómico. Sin embargo, esto no es correcto, el algoritmo no es el tiempo polinómico.

El uso de subrutinas de tiempo polinómico en un algoritmo de tiempo polinómico es tiempo polinómico. El problema es que, en general, esto no tiene que ser cierto si los valores devueltos por las subrutinas no son de tamaño polinómico en la entrada original y asumimos que hacemos asignaciones sobre los valores que regresan de las subrutinas. (En el modelo TM tenemos que leer la salida de cualquier subrutina de tiempo polinomial bit por bit.) Aquí el tamaño del valor devuelto por el algoritmo $Cook$ está aumentando (puede ser una potencia del tamaño de la entrada que se le da , la potencia exacta depende del tiempo de ejecución de $A$ y está alrededor de $p^2(|input|)$ , así como sabemos que $A$ no puede ser menor que el tiempo lineal, $|output|$ es al menos $|input|^2$ )

El problema es similar al código simple a continuación:

Dado $x$ ,
Deje $n = |x|$ ,
Deje $y = x$ ,
Para $i$ de $1$ a $n$ do
- Deje $y = y^{|y|}$ , (es decir, concatenación de $|y|$ copias de $y$ )
Regresar y

Cada vez que ejecutamos $y = y^{|y|}$ cuadramos el tamaño de $y$ . Después de $n$ ejecuciones tendremos una $y$ que es $x^{2^n}$ y tiene un tamaño $n2^n$ , obviamente no es un polinomio en el tamaño de la entrada.

Supongamos que solo consideramos fórmulas cuantificadas con $k(n)$ alternancias cuantificadoras (donde $n$ es el tamaño total de la fórmula cuantificada).

Supongamos que $A$ ejecuta en el tiempo $p$ ( . Ej., Tiempo lineal que no se ha descartado hasta ahora), y tal vez tenga un algoritmo $Cook$ más eficiente que genere un circuito más pequeño de tamaño $l(t)$ en lugar de $t^2$ , entonces obtenemos un algoritmo para ExtCircuitSat que se ejecuta en el tiempo $(l\circ p)^{O(k)}(n)=\underbrace{l(p(l(p(\dots(l(p(n)))))))}_{O(k)\mbox{ compositions}}$ . Incluso en el caso de que tanto $l$ y $p$ eran lineales (pero con coeficiente total de $a\geq 2$ ) que se pueden conseguir un algoritmo que se ejecuta en tiempo $\Omega(n2^{k(n)})$ y si $k(n) = \Theta(n)$ se sería $\Omega(n2^n)$ similar al algoritmo de fuerza bruta (e incluso esto se basó en suponer que Cook-Levin se puede realizar en algoritmos que resultan en circuitos de tamaño lineal en el tiempo de ejecución del algoritmo).

— Kaveh
fuente

¡Realmente me gusta esta respuesta!

— Tayfun Pay

@kaveh ¿Qué sucede si

mientras

entonces, necesitamos al menos un tiempo exponencial doble para

? Su argumento parece sugerir esa posibilidad mientras sabemos que

está en

y, entonces, ¿cómo recuperar el exponencial simple?

p (n) = 2^{Ω (n)}

$p(n)=2^{\Omega(n)}$

l (t) = O (t)

$l(t)=O(t)$

N P^{N P^{N P}}

$NP^{NP^{NP}}$

P S P A C E

$PSPACE$

E X P

$EXP$

— T ....

3

Creo que esto se debe a que en cada nivel del PH, el número de alternancias es una constante (es decir, independiente del tamaño de entrada), mientras que en AP, el número de alternancias puede ser ilimitado (pero polinomial en el tamaño de la entrada).

— MS Dousti
fuente