Técnicas para invertir el orden de los cuantificadores

73

Es bien sabido que, en general, el orden de los cuantificadores universales y existenciales no puede invertirse. En otras palabras, para una fórmula lógica general , $\phi(\cdot,\cdot)$

$(\forall x)(\exists y) \phi(x,y) \quad \not\Leftrightarrow \quad (\exists y)(\forall x) \phi(x,y)$

Por otro lado, sabemos que el lado derecho es más restrictivo que el lado izquierdo; es decir, $(\exists y)(\forall x) \phi(x,y) \Rightarrow (\forall x)(\exists y) \phi(x,y)$ .

Esta pregunta se centra en las técnicas para derivar $(\forall x)(\exists y) \phi(x,y) \Rightarrow (\exists y)(\forall x) \phi(x,y)$ , siempre que sea válido para $\phi(\cdot,\cdot)$ .

La diagonalización es una de esas técnicas. Primero veo este uso de la diagonalización en el artículo Relativizaciones de la pregunta $\mathcal{P} \overset{?}{=} \mathcal{NP}$ (véase también la nota breve de Katz ). En ese documento, los autores primero prueban que:

Para cualquier máquina de oráculo de tiempo polinomial determinista M, existe un lenguaje B tal que $L_B \ne L(M^B)$ .

Luego invierten el orden de los cuantificadores (usando diagonalización ), para demostrar que:

Existe un lenguaje B tal que para todos los deterministas, poli-tiempo M, tenemos . $L_B \ne L(M^B)$

Esta técnica se utiliza en otros documentos, como [CGH] y [AH] .

Encontré otra técnica en la prueba del Teorema 6.3 de [IR] . Utiliza una combinación de la teoría de la medida y el principio del agujero de paloma para invertir el orden de los cuantificadores.

Quiero saber qué otras técnicas se utilizan en informática para invertir el orden de los cuantificadores universales y existenciales.

lo.logic big-picture proof-techniques

— MS Dousti
fuente

14

Wow, esta es una gran pregunta. Solo leerlo me hizo ver los objetos "familiares" de manera diferente. ¡Gracias!

— Mark Reitblatt

68

La inversión de cuantificadores es una propiedad importante que a menudo está detrás de teoremas bien conocidos.

Por ejemplo, en el análisis, la diferencia entre y es la diferencia entre continuidad puntual y uniforme . Un teorema bien conocido dice que cada mapa continuo puntual es uniformemente continuo, siempre que el dominio sea agradable, es decir, compacto . $\forall \epsilon > 0 . \forall x . \exists \delta > 0$ $\forall \epsilon > 0 . \exists \delta > 0 . \forall x$

De hecho, la compacidad está en el corazón de la inversión del cuantificador. Consideremos dos tipos de datos y de los cuales es abierta y es compacto (ver más abajo para una explicación de estos términos), y dejar que sea una relación semidecidable entre y . La declaración se puede leer de la siguiente manera: cada punto en está cubierto por alguna . Dado que los conjuntos son "computablemente abiertos" (semidecidables) e $X$ $Y$ $X$ $Y$ $\phi(x,y)$ $X$ $Y$ $\forall y : Y . \exists x : X . \phi(x,y)$ $y$ $Y$ $U_x = \lbrace z : Y \mid \phi(x,z) \rbrace$ $U_x$ $Y$ es compacto, existe una subcubierta finita. Hemos demostrado que implica A menudo podemos reducir la existencia de la lista finita a una sola . Por ejemplo, si está ordenado linealmente y es monótono en con respecto al orden, entonces podemos considerar que es el más grande de .

\forall y : Y . \exists x : X . ϕ (x, y)

$\forall y : Y . \exists x : X . \phi(x,y)$

\exists x_{1}, \dots, x_{n} : X . \forall y : Y . ϕ (x_{1}, y) \lor \dots \lor ϕ (x_{n}, y) .

$\exists x_1, \ldots, x_n : X . \forall y : Y . \phi(x_1,y) \lor \cdots \lor \phi(x_n, y).$

x_{1}, \dots, x_{n}

$x_1, \ldots, x_n$

x

$x$

X

$X$

ϕ

$\phi$

x

$x$

x

$x$

x_{1}, \dots, x_{n}

$x_1, \ldots, x_n$

Para ver cómo se aplica este principio en un caso familiar, veamos la afirmación de que es una función continua. Mantenemos como una variable libre para no confundirnos con un cuantificador universal externo: Como es compacto y la comparación de reales es semidecidable, la declaración es semidecidable. Los reales positivos son evidentes y es compacto, por lo que podemos aplicar el principio: $f : [0,1] \to \mathbb{R}$ $\epsilon > 0$

\forall x \in [0, 1] . \exists δ > 0 . \forall y \in [x - δ, x + δ] . | f (y) - f (x) | < ϵ .

$\forall x \in [0,1] . \exists \delta > 0 . \forall y \in [x - \delta, x + \delta] . |f(y) - f(x)| < \epsilon.$

[x - δ, x + δ]

$[x - \delta, x + \delta]$

ϕ (x, δ) \equiv \forall y \in [x - δ, x + δ] . | f (y) - f (x) | < ϵ

$\phi(x, \delta) \equiv \forall y \in [x - \delta, x + \delta] . |f(y) - f(x)| < \epsilon$

[0, 1]

$[0,1]$

\exists δ_{1}, δ_{2}, \dots, δ_{n} > 0 . \forall x \in [0, 1] . ϕ (δ_{1}, x) \lor \dots ϕ (δ_{n}, x) .

$\exists \delta_1, \delta_2, \ldots, \delta_n > 0 . \forall x \in [0,1] . \phi(\delta_1, x) \lor \cdots \phi(\delta_n, x).$ Como es antimonotono en el más pequeño de hace el trabajo, por lo que solo necesitamos un : Lo que tenemos es una continuidad uniforme de .

ϕ (δ, x)

$\phi(\delta, x)$

δ

$\delta$

δ_{1}, \dots, δ_{n}

$\delta_1, \ldots, \delta_n$

δ

$\delta$

\exists δ > 0 . \forall x \in [0, 1] . \forall y \in [x - δ, x + δ] . | f (y) - f (x) | < ϵ .

$\exists \delta > 0 . \forall x \in [0,1] . \forall y \in [x - \delta, x + \delta] . |f(y) - f(x)| < \epsilon.$

f

$f$

Hablando vagamente, un tipo de datos es compacto si tiene un cuantificador universal computable y evidente si tiene un cuantificador existencial computable. Los enteros (no negativos) están abiertos porque para decidir si , con semidecidable, realizamos la búsqueda paralela haciendo cola de milano . El espacio de Cantor es compacto y abierto, como lo explica la Dualidad de piedra abstracta de Paul Taylor y la " Topología sintética de tipos de datos y espacios clásicos " de Martin Escardo (véase también la noción relacionada de espacios de búsqueda ). $\mathbb{N}$ $\exists n \in \mathbb{N} . \phi(n)$ $\phi(n)$ $2^\mathbb{N}$

Apliquemos el principio al ejemplo que mencionó. Vemos un idioma como un mapa de palabras (finitas) sobre un alfabeto fijo a valores booleanos. Como las palabras finitas están en correspondencia biyectiva computable con enteros, podemos ver un lenguaje como un mapa de enteros a valores booleanos. Es decir, el tipo de datos de todos los lenguajes es, hasta el isomorfismo computable, precisamente el espacio de Cantor nat -> bool, o en notación matemática , que es compacto. Una máquina de Turing de tiempo polinómico se describe por su programa, que es una cadena finita, por lo tanto el espacio de todos (representaciones de) las máquinas de Turing se pueden tomar para ser o , que es manifiesta. $2^\mathbb{N}$ nat $\mathbb{N}$

Dada una máquina de Turing y un lenguaje , la declaración que dice "el lenguaje es rechazado por " es semidecida porque de hecho es decidible: simplemente ejecute con la entrada y vea qué lo hace. ¡Se cumplen las condiciones para nuestro principio! La declaración "cada máquina de oráculo tiene un lenguaje tal que no es aceptado por " se escribe simbólicamente como Después de la inversión de cuantificadores obtenemos $M$ $c$ $\mathsf{rejects}(M,c)$ $c$ $M$ $M$ $c$ $M$ $b$ $b$ $M^b$

\forall M : N . \exists b : 2^{N} . r e j e c t s (M^{b}, b) .

$\forall M : \mathbb{N} . \exists b : 2^\mathbb{N} . \mathsf{rejects}(M^b,b).$

\exists b_{1}, \dots, b_{n} : 2^{N} . \forall M : N . r e j e c t s (M^{b_{1}}, b_{1}) \lor \dots \lor r e j e c t s (M^{b_{n}}, b_{n}) .

$\exists b_1, \ldots, b_n : 2^\mathbb{N} . \forall M : \mathbb{N} . \mathsf{rejects}(M^{b_1}, b_1) \lor \cdots \lor \mathsf{rejects}(M^{b_n},b_n).$ Ok, entonces tenemos pocos idiomas finitos. ¿Podemos combinarlos en uno solo? Lo dejaré como ejercicio (¡para mí y para ti!).

También te puede interesar la pregunta un poco más general de cómo transformar a una declaración equivalente de la forma , o viceversa. Hay varias formas de hacerlo, por ejemplo: $\forall x . \exists y . \phi(x,y)$ $\exists u . \forall v . \psi(u,v)$

— Andrej Bauer
fuente

44

Es una condición muy general (un espacio debe ser abierto, el otro compacto y la relación abierta), pero también es una técnica: si puede encontrar topologías que satisfagan las condiciones, puede invertir los cuantificadores.

— Andrej Bauer

8

@Andrej, tu respuesta es realmente buena y educativa. Nunca supe que hay una relación entre la compacidad y los cuantificadores de inversión, hasta que aparece esta publicación. Me siento iluminado

— Hsien-Chih Chang 張顯之

8

Qué respuesta tan asombrosa.

— Suresh Venkat

10

Me siento halagado. Desearía que más personas supieran sobre las conexiones íntimas entre lógica, computación y topología.

— Andrej Bauer el

66

@Andrej: ¿Hay una buena referencia (especialmente un libro o una nota de conferencia) sobre las "conexiones íntimas entre lógica, computación y topología"?

— MS Dousti

25

El lema de conjunto de núcleo duro de Impagliazzo le permite cambiar cuantificadores en el contexto de supuestos de dureza computacional. Aquí está el artículo original . Puedes buscar toneladas de artículos y publicaciones relacionadas buscando en Google.

El lema dice que si para cada algoritmo A existe un gran conjunto de entradas en el que A no puede calcular una función fija f, entonces, de hecho , existe un gran conjunto de entradas en el que cada algoritmo no puede calcular f con una probabilidad cercana a 1 / 2.

Este lema puede probarse utilizando el teorema min-max o refuerzo (una técnica de la teoría del aprendizaje computacional), los cuales son ejemplos de cambio de cuantificadores.

— Manu
fuente

3

Ese es un excelente punto.

— Suresh Venkat

17

Para mí, la prueba "canónica" del teorema de Karp-Lipton (que ) tiene este sabor. Pero aquí no es el enunciado del teorema real en el que se invierten los cuantificadores, sino más bien los "cuantificadores" se invierten dentro del modelo de computación alterna, utilizando el supuesto de que tiene circuitos pequeños. $NP \subseteq P/poly \Longrightarrow \Pi_2 P = \Sigma_2 P$ $NP$

Desea simular un cálculo del formulario.

$(\forall y)(\exists z)R(x,y,z)$

donde es un predicado de tiempo polinómico. Puede hacer esto adivinando un pequeño circuito para (digamos) satisfacción, modificando para que se verifique a sí mismo y produzca una asignación satisfactoria cuando su entrada sea satisfactoria. Luego, para todo , cree una instancia SAT que sea equivalente a y resuélvala. Entonces has producido un cálculo equivalente de la forma $R$ $C$ $C$ $y$ $S(x,y)$ $(\exists z)R(x,y,z)$

$(\exists C)(\forall y)[S(x,y)$ es satisfactoria de acuerdo con . $C]$

— Ryan Williams
fuente

¡Excepcional! Este es un ejemplo de cambio de cuantificador basado en suposiciones.

— MS Dousti

Aunque esto es perfectamente correcto, quería sugerir escribir lugar de , ya que NP nunca puede ser igual a P / poly.

N P \subset P / p o l y

$NP \subset P/poly$

N P \subseteq P / p o l y

$NP \subseteq P/poly$

— MS Dousti

12

El uso básico de unión unida en el método probabilístico puede interpretarse como una forma de revertir el orden de los cuantificadores. Aunque esto ya se menciona en la pregunta implícitamente porque la prueba de Impagliazzo y Rudich es un ejemplo de esto, creo que vale la pena declararlo más explícitamente.

Suponga que X es finito y que por cada x ∈ X , sabemos no solo que y ∈ Y satisface φ ( x , y ) sino también que muchas opciones de y ∈ Y satisfacen φ ( x , y ). Formalmente, supongamos que sabemos (∀ x ∈ X ) Pr _{y ∈ Y} [￢φ ( x , y )] <1 / | X | para alguna medida probabilística en Y. Entonces, el límite de unión nos permite concluir Pr _{y ∈ Y} [(∃ x ∈ X ) ￢φ ( x , y )] <1, que es equivalente a (∃ y ∈ Y ) (∀ x ∈ X ) φ ( x , y )

Hay variaciones de este argumento:

Si X es infinito, a veces podemos discretizar X considerando una métrica adecuada en X y una ε -net de la misma. Después de discretizar X , podemos usar la unión enlazada como arriba.
Cuando los eventos φ ( x , y ) para diferentes valores de x son casi independientes, podemos usar el lema local de Lovász en lugar de la unión.

— Tsuyoshi Ito
fuente

2

Tsuyoshi, esto está terriblemente fuera de tema, pero es hora de nominarte a ti mismo como moderador :)

— Suresh Venkat

10

Me gustaría agregar varias otras técnicas. Aunque las dos primeras técnicas no son exactamente para invertir el orden de los cuantificadores universales y existenciales, tienen un sabor muy similar. Por lo tanto, aproveché la oportunidad para describirlos aquí:

Lema promedio: se utiliza para probar y muchos otros teoremas interesantes. Informalmente , suponga que denota el conjunto de suscriptores de alguna biblioteca, denota el conjunto de libros en la biblioteca, y para y , la proposición es verdadera si "suscriptor le gusta el libro ". El lema de promedios establece que: si por cada , existe al menos 2/3 de 's en modo que mantiene, entonces existe una sola $BPP \subset P/poly$ $S$ $B$ $s\in S$ $b \in B$ $\phi(s,b)$ $s$ $b$ $s \in S$ $b$ $B$ $\phi(s,b)$ $b \in B$ , de modo que para al menos 2/3 de en , la proposición cumple. (Esto se puede probar fácilmente a través de reductio ad absurdum y un argumento de conteo). $s$ $S$ $\phi(s,b)$

Ahora vamos a , y dejar que es una máquina de PPT que decide . Suponga que el tiempo de ejecución de está limitado por un polinomio . Entonces, para cualquier , y para al menos 2/3 de 's, , sostiene que . Aquí, es la máquina que utiliza aleatoriedad , y es la función característica de . El lema de promedio se usa para mostrar que para cualquier $L \in BPP$ $M(\cdot)$ $L$ $M$ $q(\cdot)$ $x \in \{0,1\}^*$ $r$ $r \in \{0,1\}^{q(|x|)}$ $M_r(x) = \chi_L(x)$ $M_r(\cdot)$ $M$ $r$ $\chi_L(\cdot)$ $L$ $n \in \mathbb{N}$ , existe una única , de modo que al menos 2/3 de 's de longitud , . Esta única funciona como un consejo para y, por lo tanto, . $r \in \{0,1\}^{q(n)}$ $x$ $n$ $M_r(x) = \chi_L(x)$ $r$ $M$ $BPP \subset P/poly$

NOTE: I re-emphasize that this is not a quantifier switching technique, but it has the same spirit.

Lema de intercambio: Zachos y Fürer introdujeron un nuevo cuantificador probabilístico exist (que significa aproximadamente "para la mayoría"). Probaron que (omitiendo detalles): $\exists^+$

$(\forall y)(\exists^+z) \phi(x,y,z) \Rightarrow (\exists^+ \mathbf{C})(\forall y)(\exists z \in \mathbf{C})\phi(x,y,z)$

Tenga en cuenta que este es un teorema lógico de segundo orden.

Utilizando el lema de intercambio, demostraron una serie de teoremas interesantes, como el teorema BPP y el teorema Babai . Le remito al documento original para más información. $MA \subseteq AM$

Un teorema similar al teorema Karp-Lipton mencionado en Ryan Williams mensaje: . $coNP \subset NP/Poly \Longrightarrow \Pi_3 P = \Sigma_3 P$

— MS Dousti
fuente

Nitpicking: me gustaría señalar que la prueba real de BPP⊆P / poly requiere un poco más de lo que está escrito aquí, porque una cadena de consejos que funciona solo para 2/3 de la fracción de instancias es insuficiente. Pero creo que el punto importante de la primera mitad de esta respuesta es que la prueba de BPP⊆P / poly puede verse como algo similar a la inversión del cuantificador, que es perfectamente válido.

— Tsuyoshi Ito

@ Tsuyoshi: Tienes razón. Pero el resto de la prueba utiliza la repetición secuencial y el límite de Chernoff, para demostrar la existencia de una que funciona para todos menos una fracción exponencialmente pequeña de entradas; y como dijiste, eso no tiene que ver con la inversión del cuantificador, así que lo omití.

r

$r$

— MS Dousti

No estoy seguro si entendiste mi punto. Mi punto es que la declaración del "lema promedio" no es suficiente para probar BPP⊆P / poly. Necesita una estimación ligeramente más fina, es decir, la estimación de la probabilidad esperada E_b [Pr_s φ (s, b)] en lugar de max_b [Pr_s φ (s, b)].

— Tsuyoshi Ito

@ Tsuyoshi: Me temo que no te entendí. En el comentario anterior, noté que primero amplificamos el error de 1/3 a , y luego aplicamos el lema de promedio. Aquí hay una prueba completa, tomada del libro de Goldreich. ¿Me estoy perdiendo de algo?

2^{- | x |}

$2^{-|x|}$

— MS Dousti

¡Gracias! Había estado entendiendo mal tu comentario. No sabía que BPP⊆P / poly se puede probar reduciendo primero el error y luego aplicando el lema de promedio (estaba pensando en el orden opuesto).

— Tsuyoshi Ito