¿Cuál es el mínimo sobre todas las distribuciones de vectores unitarios de la varianza del producto escalar de los vectores?

$n$ $x_1,\ldots, x_n$ $k$ $n > k$ $\max_{i\neq j} \mathrm{Var}(x_i^T x_j)$ $\mathbb{E}[x_i^Tx_j]=0$

Intenté algunas distribuciones y casi todas tienen varianza $1/k$ . Por ejemplo, tanto la distribución en la que cada coordenada de cada $x_i$ se elige de forma independiente y uniforme entre $\left\{-1/\sqrt{k}, 1/\sqrt{k}\right\}$ y la distribución en la que cada $x_i$ es un vector uniforme independiente en la esfera de la unidad $k$ -dimensional tiene varianza $1/k$ .

¿Es $1/k$ la varianza mínima entre todas las distribuciones?

reference-request randomized-algorithms

— peng
fuente

¿Qué tan apretado estás interesado? Es decir, ¿sería interesante o no un límite inferior de 1 / 100k que solo funciona para n> 100k?

— daniello

@daniello, ¿te refieres a un límite inferior de 1 / ck para n> ck donde c es algo constante? ¿Cómo probar esto?

— peng

Algo que no entiendo en la pregunta: al principio dices distribución sobre vectores unitarios , pero no todas las distribuciones que dices que intentaste generar vectores unitarios ... ¿Quieres decir que para todos , ?

x_{i}

$x_i$

E [| x_{i} |] = 1

$E[|x_i|] = 1$

— daniello

@deniello, tenía la intención de hacer que todos los vectores fueran "unidad". Lo siento, olvidé hacer la normalización en el vector "gaussiano", después de la normalización, será lo mismo que el vector uniforme. Gracias por señalar este error.

— peng

Presentaré una formulación equivalente pero más simple del problema, y mostraré un límite inferior de ( n / k - 1) / ( n −1). ~~También muestro una conexión a un problema abierto en la información cuántica.~~ [Editar en la revisión 3: En revisiones anteriores, afirmé que una caracterización exacta de los casos en los que se alcanza el límite inferior que se muestra a continuación probablemente sea difícil porque una pregunta análoga en el caso complejo incluye un problema abierto sobre SIC-POVM en Información cuántica. Sin embargo, esta conexión a SIC-POVM fue incorrecta. Para obtener detalles, consulte la sección "Conexión incorrecta a SIC-POVM en la información cuántica" a continuación.]

Formulación equivalente

Primero, como ya se señaló en la respuesta de daniello, tenga en cuenta que Var ( x _i^Tx _j ) = E [( x _i^Tx _j ) ² ] - E [ x _i^Tx _j ] ² = E [( x _i^Tx _j ) ² ]. Entonces, en el resto de la respuesta, nos olvidamos de la varianza y en su lugar minimizamos max _{i ≠ j} E [( x _i^Tx _j ) ² ].

Luego, una vez que decidamos que nuestro objetivo es minimizar max _{i ≠ j} E [( x _i^Tx _j ) ² ], podemos ignorar la restricción de que E [ x _i^Tx _j ] = 0. Esto se debe a que si tenemos vectores unitarios x ₁ ,…, x _n , entonces podemos negar cada uno de ellos independientemente con probabilidad 1/2 para satisfacer E [ x _i^Tx _j ] = 0 sin cambiar el valor de la función objetivo max _{i ≠ j} E [( x _i^Tx _j) ² ].

Además, cambiar la función objetivo de max _{i ≠ j} E [( x _i^Tx _j ) ² ] a (1 / ( n ( n −1))) ∑ _{i ≠ j} E [( x _i^Tx _j ) ² ] No cambia el valor óptimo. El último es, como máximo, el primero porque el promedio es como máximo el máximo. Sin embargo, siempre podemos hacer los valores de E [( x _i^Tx _j ) ² ] para diferentes opciones de ( i , j ) ( i ≠j ) igual al permutar los n vectores x ₁ , ..., x _n al azar.

Así que para cualquier n y k , el valor óptimo del problema en cuestión es igual al mínimo de (1 / ( n ( n -1))) Σ _{i ≠ j} E [( x _i^Tx _j ) ² ] donde x ₁ , ..., x _n son variables aleatorias que toman vectores unitarios en ℝ ^k como valores.

Sin embargo, por linealidad de expectativa, esta función objetivo es igual al valor esperado E [(1 / ( n ( n −1))) ∑ _{i ≠ j} ( x _i^Tx _j ) ² ]. Como el mínimo es como máximo el promedio, ya no es necesario considerar las distribuciones de probabilidad. Es decir, el valor óptimo del problema anterior es igual al valor óptimo de lo siguiente:

Elija los vectores unitarios x ₁ ,…, x _n ∈ ℝ ^k para minimizar (1 / ( n ( n −1))) ∑ _{i ≠ j} ( x _i^Tx _j ) ² .

Límite inferior

Usando esta formulación equivalente, demostraremos que el valor óptimo es al menos ( n / k - 1) / ( n −1).

Para 1≤ i ≤ n , sea X _i = x _i x _i^T el proyector de rango 1 correspondiente al vector unitario x _i . Luego, sostiene que ( x _i^Tx _j ) ² = Tr ( X _i X _j ).

Deje Y = ∑ _i X _i . Luego, sostiene que ∑ _{i ≠ j} Tr ( X _i X _j ) = ∑ _{i , j} Tr ( X _i X _j ) - n = Tr ( Y ² ) - n .

La desigualdad de Cauchy-Schwarz implica que Tr ( Y ² ) ≥ (Tr Y ) ² / k = n ² / k , y por lo tanto ∑ _{i ≠ j} Tr ( X _i X _j ) = Tr ( Y ² ) - n ≥ n ² / k - n . Al dividir por n ( n −1), obtenemos que el valor objetivo es al menos ( n / k - 1) / ( n −1).

En particular, cuando n = k +1, la respuesta de daniello está dentro de un factor de 2 desde el valor óptimo.

¿Cuándo es alcanzable este límite inferior?

La consecución de este límite inferior ( n / k - 1) / ( n -1) es equivalente a hacer Y = ( n / k ) I . No sé la caracterización exacta cuando es posible, pero existen las siguientes condiciones:

Cuando n = k +1, se puede obtener considerando k +1 vectores unitarios que forman un k -simplex regular centrado en el origen, mejorando de 2 / ( k ( k +1)) en la respuesta de daniello a 1 / k óptimo ² .
Cuando n es un múltiplo de k , es claramente alcanzable fijando una base ortonormal de ℝ ^k y asignando cada uno de los vectores de base a n / k de v ₁ , ..., v _n .
De manera más general que el último punto, si es alcanzable con alguna opción de k y n = n ₁ y n = n ₂ , entonces también es alcanzable para el mismo k y n = n ₁ + n ₂ . En particular, es alcanzable si n = a k + b donde a y b son enteros que satisfacen a ≥ b ≥0.

Aunque no he verificado los detalles, parece que cualquier diseño esférico en 2 proporciona una solución para alcanzar este límite inferior.

Conexión incorrecta a SIC-POVM en información cuántica

En revisiones anteriores, dije:

Sospecho que responder esto completamente es una pregunta difícil. La razón es que si consideramos el espacio vectorial complejo ℂ ^k , esta pregunta está relacionada con un problema abierto en la información cuántica.

Pero esta relación era incorrecta. Explicaré por qué.

Más precisamente, considere el siguiente problema:

Elija los vectores unitarios x ₁ ,…, x _n ∈ ℂ ^k para minimizar (1 / ( n ( n −1))) ∑ _{i ≠ j} | x _i^*x _j | ² .

El límite inferior anterior se mantiene igualmente en esta versión compleja. Considere el caso donde n = k ² en la versión compleja. Entonces el límite inferior es igual a 1 / ( k +1).

Hasta ahora, fue correcto.

Un conjunto de k ² vectores unitarios x ₁ , ..., x _{k ²} ∈ ℂ ^{k que} alcanzan el límite inferior se llama SIC-POVM en la dimensión k ,

Esta parte fue incorrecta. Un SIC-POVM es un conjunto de k ² vectores unitarios x ₁ ,…, x _n ∈ ℂ ^k para los cuales | x _i^*x _j | ² = 1 / ( k +1) para todo i ≠ j . Tenga en cuenta que aquí el requisito debe cumplir para todos los pares i ≠ j , no solo el promedio sobre todos los pares i ≠ j . En la sección "Formulación equivalente", mostramos la equivalencia entre minimizar el máximo y minimizar el promedio, pero esto fue posible porque x ₁, ..., x _n eran variables aleatorias que tomaban vectores unitarios allí. Aquí x ₁ , ..., x _n son solo vectores unitarios, por lo que no podemos usar el mismo truco.

— Tsuyoshi Ito
fuente

$v_1, v_2, \ldots, v_k$ $\{1,2,\ldots,k+1\}$ $x_i = x_j = v_1$ $x_t$ $t \notin \{i,j\}$ $v_2, \ldots, v_k$ $t \in \{1,\ldots,k+1\}$ $x_i$ $-x_i$ $\frac{1}{2}$

$E[x_a \cdot x_b] = 0$ $x_a$ $x_b$ $\frac{1}{2}$

Por otro lado tenemos $Var[x_a \cdot x_b] = E[(x_a \cdot x_b)^2]$ $(x_a \cdot x_b)^2 = 1$ $\{a,b\} = \{i,j\}$ $\frac{1}{k+1 \choose 2}$ $(x_a \cdot x_b)^2 = 0$ $a$ $b$

V una r [X_{una} \cdot X_{si}] = mi [(X_{una} \cdot X_{si})^{2}] = \frac{1}{(\binom{k + 1}{2})}

$Var[x_a \cdot x_b] = E[(x_a \cdot x_b)^2] = \frac{1}{k+1 \choose 2}$

Mi intuición es que esto es tan malo (pequeño) como se pone, pero no tengo una prueba. Más interesante es que esta construcción parece romperse para n >> k, y también cuando el $x_i$ 's tienen que ser elegidos de forma independiente (posiblemente de diferentes distribuciones).

— daniello
fuente