¿Precisión numérica en el método de suma de cuadrados?


13

He estado leyendo un poco sobre el método de suma de cuadrados (SOS) de la encuesta de Barak & Steurer y las notas de clase de Barak . En ambos casos, barren problemas de precisión numérica debajo de la alfombra.

Desde mi comprensión (ciertamente limitada) del método, lo siguiente debería ser cierto:

Dado cualquier sistema de igualdades polinómicas E sobre variables de valor real xRn , donde todos los parámetros son O(1) ( n , |E| y grado de cada restricción), el grado- " 2n " ( =O(1) ) El método SOS encuentra una asignación satisfactoria de las variables o prueba que no existe ninguna en el tiempo O(1) .

Mi primera pregunta es si la afirmación anterior es cierta (¿hay algún argumento ingenuo que no use SOS para resolver esto?). La segunda pregunta es dónde encaja la precisión numérica. Si quiero obtener una asignación que satisfaga todas las restricciones dentro de la precisión aditiva ε , ¿cómo depende el tiempo de ejecución de 1/ε ? En particular, ¿es polinomial?

La motivación para esto es, por ejemplo, aplicar un enfoque de divide y vencerás en un sistema grande hasta que el caso base sea un sistema de tamaño O(1) .

EDITAR: De Barak-Steurer, parece que el " algoritmo de suma de cuadrados de grado " en la página 9 (y los párrafos que lo conducen) definen problemas para soluciones sobre R , y de hecho la definición de un pseudo -Distribución en la sección 2.2 es más de R . Ahora veo en Lemma 2.2, sin embargo, que no se garantiza una solución / refutación en el grado 2 n sin variables binarias.lRR2n

Entonces puedo refinar mi pregunta un poco. Si sus variables no son binarias, la preocupación es que la secuencia de salidas no es finita (¿tal vez ni siquiera un aumento monotónico?). Entonces la pregunta es: ¿ φ ( l ) sigue aumentando? Y si es así, hasta qué punto se tiene que ir a conseguir una precisión aditivo ε ?φ(l)φ(l)ε

Aunque esto probablemente no cambia nada, me he enterado de mi sistema es satisfiable (no hay refutación de cualquier grado), así que estoy realmente preocupado por lo grande que tiene que ser. Finalmente, estoy interesado en una solución teórica, no en un solucionador numérico.l


Respuestas:


1

Aquí está el comentario de Boaz Barak sobre el tema:

Barremos la precisión numérica debajo de la alfombra: la literatura SOS más "tradicional" de Parrilo, Lasserre, etc. trata estos temas (por ejemplo, ver las encuestas de Monique Laurent y las referencias allí). Se sabe que la jerarquía es monótona (no es difícil ver que un grado psuedo-distribución es en particular un grado l - 1 uno), y que convergerá en grado finito para cualquier conjunto fijo de ecuaciones (esto es Positivstellensatz). El grado exacto puede variar. En general, si todos los coeficientes de los polinomios están delimitados y está tratando de distinguir entre el caso de que haya una solución y el caso de que en cualquier asignación una de las ecuaciones esté desactivada por ϵ , entonces uno podría discretizar esto a unll1ϵ -net para δ relacionado con el número de variables, el grado de ecuaciones y ϵ , y luego (suponiendo que la red sea lo suficientemente "agradable" y "parecida a un cubo") el grado requerido debería registrar aproximadamente el tamaño de la red.δδϵ


Publicado como respuesta para evitar que el bot de la comunidad vuelva a plantear la pregunta en el futuro.
Kaveh

1

Creo que mi respuesta es probablemente insuficiente, pero sigue siendo por completo (aunque vea los comentarios de Boaz a continuación para probablemente una mejor respuesta)

Cuando nos limitamos a las variables booleanas, la afirmación se puede ver cuando para todo i [ n ] con la observación de que grado 2 n(xi21)Ei[n]2n pseudodistribuciones de son distribuciones reales, es decir, supongamos que tiene una pseudodistribución sobre soluciones x de sus igualdades polinómicas E satisfactoria:μ(x)xE

yx { - 1 , 1 } n μ ( x ) p 2 ( x ) 0 para todos los polinomios p con grado máximo nx{1,1}nμ(x)x{1,1}nμ(x)p2(x)0pn

Pero los polinomios de grado incluyen el polinomio indicador (por ejemplo, x 1 = 1 , x 2 = - 1 , x 3 = 1 tiene 2 - 3 ( 1 + x 1 ) ( 1 - x 2 ) ( 1 + x - 1 , 1 } n , por lo que concluimos que μ es una distribución real sobre las soluciones de E. Grado nx1=1,x2=1,x3=1 que es todo cero en otro lugar y 1 en esa asignación). Entonces μ ( x ) 0 para todo x {23(1+x1)(1x2)(1+x3)μ(x)0x{1,1}nμEpseudo-distribuciones se pueden encontrar mediante el uso de programación semidefinida para encontrar un grado asociado operador pseudo-expectativa en n O ( ) tiempo, por lo que podemos encontrar la distribución realnO() en el tiempo n O ( n ) usando ese pseudo expectativa (ahora una expectativa real) para encontrar todos los momentos de μ .μnO(n)μ

Entonces, si , entonces puede encontrar una distribución de soluciones a E en O ( 1 ) tiempo. Por supuesto, la búsqueda de fuerza bruta garantiza lo mismo.|E|=O(1)EO(1)

Sin embargo, si las soluciones no son necesariamente booleanas, entonces las pseudo-expectativas de grado no son suficientes para encontrar una distribución sobre las soluciones. Como se puede ver arriba, la prueba de que las pseudodistribuciones de grado 2 n son distribuciones reales depende del hecho de que los polinomios de grado n son suficientes para 'seleccionar' asignaciones individuales, lo que no es cierto en general. Otra forma de verlo es que se consideran polinomios de variable booleana2n2nn, entonces el grado de cada monomio es como máximon.mod(xi2)n

Por ejemplo, uno podría considerar reemplazar cada variable binaria con una variable de 4 arios, digamos incluyendo . Entonces tendría que tener un grado 4 n de pseudo-expectativa para garantizar la recuperación de una distribución sobre soluciones.(xi21)(xi24)E4n

Ahora, para garantías teóricas, parece que aproximarse a la raíz de un sistema de polinomios también se conoce como el problema número 17 de Smale, y aparentemente hay un algoritmo de tiempo polinomial aleatorio (Las Vegas) que resuelve esto: consulte http://arxiv.org /pdf/1211.1528v1.pdf . Tenga en cuenta que esto parece estar en el modelo Blum-Shub-Smale, por lo que las operaciones reales son primitivas. No estoy seguro si esto le da la garantía que necesita.


Creo que no lo he dejado claro: mis variables están en R , ya que de lo contrario podría hacer una búsqueda trivial O ( 2 n ) = O ( 1 ) sobre el hipercubo booleano. He actualizado la pregunta para reflejar esto. SDP / SOS también se aplica a problemas de optimización de entrada real, ¿verdad? xiRO(2n)=O(1)
Jeremy Kun

¡Vaya, mi error! Sí, se aplica a configuraciones más generales, aunque muchas veces simplemente asumimos que estamos en el hipercubo. He actualizado mi respuesta, aunque mi respuesta será menos clara de lo que esperaba.
Joe Bebel

10
Barremos la precisión numérica debajo de la alfombra: la literatura SOS más "tradicional" de Parrilo, Lasserre, etc. trata estos temas (por ejemplo, ver las encuestas de Monique Laurent y las referencias allí). Se sabe que la jerarquía es monótona (no es difícil ver que un grado psuedo-distribución es en particular un grado - 1 uno), y que convergerá en grado finito para cualquier conjunto fijo de ecuaciones (esto es Positivstellensatz). 1
Boaz Barak

99
ϵδδϵ

44
@BoazBarak tal vez esto podría ser una respuesta?
Suresh Venkat
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.