¿Precisión numérica en el método de suma de cuadrados?

He estado leyendo un poco sobre el método de suma de cuadrados (SOS) de la encuesta de Barak & Steurer y las notas de clase de Barak . En ambos casos, barren problemas de precisión numérica debajo de la alfombra.

Desde mi comprensión (ciertamente limitada) del método, lo siguiente debería ser cierto:

Dado cualquier sistema de igualdades polinómicas $E$ sobre variables de valor real $x \in \mathbb{R}^n$ , donde todos los parámetros son $O(1)$ ( $n$ , $|E|$ y grado de cada restricción), el grado- " $2n$ " ( $=O(1)$ ) El método SOS encuentra una asignación satisfactoria de las variables o prueba que no existe ninguna en el tiempo $O(1)$ .

Mi primera pregunta es si la afirmación anterior es cierta (¿hay algún argumento ingenuo que no use SOS para resolver esto?). La segunda pregunta es dónde encaja la precisión numérica. Si quiero obtener una asignación que satisfaga todas las restricciones dentro de la precisión aditiva $\varepsilon$ , ¿cómo depende el tiempo de ejecución de $1/\varepsilon$ ? En particular, ¿es polinomial?

La motivación para esto es, por ejemplo, aplicar un enfoque de divide y vencerás en un sistema grande hasta que el caso base sea un sistema de tamaño $O(1)$ .

EDITAR: De Barak-Steurer, parece que el " algoritmo de suma de cuadrados de grado " en la página 9 (y los párrafos que lo conducen) definen problemas para soluciones sobre , y de hecho la definición de un pseudo -Distribución en la sección 2.2 es más de . Ahora veo en Lemma 2.2, sin embargo, que no se garantiza una solución / refutación en el grado sin variables binarias. $l$ $\mathbb{R}$ $\mathbb{R}$ $2n$

Entonces puedo refinar mi pregunta un poco. Si sus variables no son binarias, la preocupación es que la secuencia de salidas no es finita (¿tal vez ni siquiera un aumento monotónico?). Entonces la pregunta es: ¿ sigue aumentando? Y si es así, hasta qué punto se tiene que ir a conseguir una precisión aditivo ? $\varphi^{(l)}$ $\varphi^{(l)}$ $\varepsilon$

Aunque esto probablemente no cambia nada, me he enterado de mi sistema es satisfiable (no hay refutación de cualquier grado), así que estoy realmente preocupado por lo grande que tiene que ser. Finalmente, estoy interesado en una solución teórica, no en un solucionador numérico. $l$

optimization sum-of-squares

— Jeremy Kun
fuente

Calcular la descomposición de la suma de cuadrados con coeficientes racionales (2008)

— Rodrigo de Azevedo

Respuestas:

Aquí está el comentario de Boaz Barak sobre el tema:

Barremos la precisión numérica debajo de la alfombra: la literatura SOS más "tradicional" de Parrilo, Lasserre, etc. trata estos temas (por ejemplo, ver las encuestas de Monique Laurent y las referencias allí). Se sabe que la jerarquía es monótona (no es difícil ver que un grado psuedo-distribución es en particular un grado uno), y que convergerá en grado finito para cualquier conjunto fijo de ecuaciones (esto es Positivstellensatz). El grado exacto puede variar. En general, si todos los coeficientes de los polinomios están delimitados y está tratando de distinguir entre el caso de que haya una solución y el caso de que en cualquier asignación una de las ecuaciones esté desactivada por , entonces uno podría discretizar esto a un $l$ $l-1$ $\epsilon$ -net para relacionado con el número de variables, el grado de ecuaciones y , y luego (suponiendo que la red sea lo suficientemente "agradable" y "parecida a un cubo") el grado requerido debería registrar aproximadamente el tamaño de la red. $\delta$ $\delta$ $\epsilon$

— Kaveh
fuente

Publicado como respuesta para evitar que el bot de la comunidad vuelva a plantear la pregunta en el futuro.

— Kaveh

Creo que mi respuesta es probablemente insuficiente, pero sigue siendo por completo (aunque vea los comentarios de Boaz a continuación para probablemente una mejor respuesta)

Cuando nos limitamos a las variables booleanas, la afirmación se puede ver cuando para todo con la observación de que grado $(x_i^2-1) \in E$ $i \in[n]$ $2n$ pseudodistribuciones de son distribuciones reales, es decir, supongamos que tiene una pseudodistribución sobre soluciones de sus igualdades polinómicas satisfactoria: $\mu(x)$ $x$ $E$

y para todos los polinomios con grado máximo $\sum_{ x \in \{-1,1\}^n} \mu(x)$ $\sum_{x\in\{-1,1\}^n} \mu(x) p^2(x)\ge0$ $p$ $n$

Pero los polinomios de grado incluyen el polinomio indicador (por ejemplo, tiene , por lo que concluimos que es una distribución real sobre las soluciones de Grado $n$ $x_1 = 1, x_2=-1, x_3=1$ que es todo cero en otro lugar y 1 en esa asignación). Entonces para todo $2^{-3}(1+x_1)(1-x_2)(1+x_3)$ $\mu(x) \ge 0$ $x\in\{-1,1\}^n$ $\mu$ $E$ $\ell$ pseudo-distribuciones se pueden encontrar mediante el uso de programación semidefinida para encontrar un grado asociado operador pseudo-expectativa en tiempo, por lo que podemos encontrar la distribución real $\ell$ $n^{O(\ell)}$ en el tiempo usando ese pseudo expectativa (ahora una expectativa real) para encontrar todos los momentos de . $\mu$ $n^{O(n)}$ $\mu$

Entonces, si , entonces puede encontrar una distribución de soluciones a en tiempo. Por supuesto, la búsqueda de fuerza bruta garantiza lo mismo. $|E| = O(1)$ $E$ $O(1)$

Sin embargo, si las soluciones no son necesariamente booleanas, entonces las pseudo-expectativas de grado no son suficientes para encontrar una distribución sobre las soluciones. Como se puede ver arriba, la prueba de que las pseudodistribuciones de grado son distribuciones reales depende del hecho de que los polinomios de grado son suficientes para 'seleccionar' asignaciones individuales, lo que no es cierto en general. Otra forma de verlo es que se consideran polinomios de variable booleana $2n$ $2n$ $n$ , entonces el grado de cada monomio es como máximo. $\mod(x_i^2)$ $n$

Por ejemplo, uno podría considerar reemplazar cada variable binaria con una variable de 4 arios, digamos incluyendo . Entonces tendría que tener un grado pseudo-expectativa para garantizar la recuperación de una distribución sobre soluciones. $(x_i^2-1)(x_i^2-4) \in E$ $4n$

Ahora, para garantías teóricas, parece que aproximarse a la raíz de un sistema de polinomios también se conoce como el problema número 17 de Smale, y aparentemente hay un algoritmo de tiempo polinomial aleatorio (Las Vegas) que resuelve esto: consulte http://arxiv.org /pdf/1211.1528v1.pdf . Tenga en cuenta que esto parece estar en el modelo Blum-Shub-Smale, por lo que las operaciones reales son primitivas. No estoy seguro si esto le da la garantía que necesita.

— Joe Bebel
fuente

Creo que no lo he dejado claro: mis variables

están en

, ya que de lo contrario podría hacer una búsqueda trivial

sobre el hipercubo booleano. He actualizado la pregunta para reflejar esto. SDP / SOS también se aplica a problemas de optimización de entrada real, ¿verdad?

x_{i}

$x_i$

R

$\mathbb{R}$

O (2^{n}) = O (1)

$O(2^n) = O(1)$

— Jeremy Kun

¡Vaya, mi error! Sí, se aplica a configuraciones más generales, aunque muchas veces simplemente asumimos que estamos en el hipercubo. He actualizado mi respuesta, aunque mi respuesta será menos clara de lo que esperaba.

— Joe Bebel

Barremos la precisión numérica debajo de la alfombra: la literatura SOS más "tradicional" de Parrilo, Lasserre, etc. trata estos temas (por ejemplo, ver las encuestas de Monique Laurent y las referencias allí). Se sabe que la jerarquía es monótona (no es difícil ver que un grado

psuedo-distribución es en particular un grado

uno), y que convergerá en grado finito para cualquier conjunto fijo de ecuaciones (esto es Positivstellensatz).

ℓ

$\ell$

ℓ - 1

$\ell-1$

— Boaz Barak

ϵ

$\epsilon$

δ

$\delta$

δ

$\delta$

ϵ

$\epsilon$

@BoazBarak tal vez esto podría ser una respuesta?

— Suresh Venkat