Presentaré una formulación equivalente pero más simple del problema, y mostraré un límite inferior de ( n / k - 1) / ( n −1). También muestro una conexión a un problema abierto en la información cuántica. [Editar en la revisión 3: En revisiones anteriores, afirmé que una caracterización exacta de los casos en los que se alcanza el límite inferior que se muestra a continuación probablemente sea difícil porque una pregunta análoga en el caso complejo incluye un problema abierto sobre SIC-POVM en Información cuántica. Sin embargo, esta conexión a SIC-POVM fue incorrecta. Para obtener detalles, consulte la sección "Conexión incorrecta a SIC-POVM en la información cuántica" a continuación.]
Formulación equivalente
Primero, como ya se señaló en la respuesta de daniello, tenga en cuenta que Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Entonces, en el resto de la respuesta, nos olvidamos de la varianza y en su lugar minimizamos max i ≠ j E [( x i T x j ) 2 ].
Luego, una vez que decidamos que nuestro objetivo es minimizar max i ≠ j E [( x i T x j ) 2 ], podemos ignorar la restricción de que E [ x i T x j ] = 0. Esto se debe a que si tenemos vectores unitarios x 1 ,…, x n , entonces podemos negar cada uno de ellos independientemente con probabilidad 1/2 para satisfacer E [ x i T x j ] = 0 sin cambiar el valor de la función objetivo max i ≠ j E [( x i T x j) 2 ].
Además, cambiar la función objetivo de max i ≠ j E [( x i T x j ) 2 ] a (1 / ( n ( n −1))) ∑ i ≠ j E [( x i T x j ) 2 ] No cambia el valor óptimo. El último es, como máximo, el primero porque el promedio es como máximo el máximo. Sin embargo, siempre podemos hacer los valores de E [( x i T x j ) 2 ] para diferentes opciones de ( i , j ) ( i ≠j ) igual al permutar los n vectores x 1 , ..., x n al azar.
Así que para cualquier n y k , el valor óptimo del problema en cuestión es igual al mínimo de (1 / ( n ( n -1))) Σ i ≠ j E [( x i T x j ) 2 ] donde x 1 , ..., x n son variables aleatorias que toman vectores unitarios en ℝ k como valores.
Sin embargo, por linealidad de expectativa, esta función objetivo es igual al valor esperado E [(1 / ( n ( n −1))) ∑ i ≠ j ( x i T x j ) 2 ]. Como el mínimo es como máximo el promedio, ya no es necesario considerar las distribuciones de probabilidad. Es decir, el valor óptimo del problema anterior es igual al valor óptimo de lo siguiente:
Elija los vectores unitarios x 1 ,…, x n ∈ ℝ k para minimizar (1 / ( n ( n −1))) ∑ i ≠ j ( x i T x j ) 2 .
Límite inferior
Usando esta formulación equivalente, demostraremos que el valor óptimo es al menos ( n / k - 1) / ( n −1).
Para 1≤ i ≤ n , sea X i = x i x i T el proyector de rango 1 correspondiente al vector unitario x i . Luego, sostiene que ( x i T x j ) 2 = Tr ( X i X j ).
Deje Y = ∑ i X i . Luego, sostiene que ∑ i ≠ j Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .
La desigualdad de Cauchy-Schwarz implica que Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , y por lo tanto ∑ i ≠ j Tr ( X i X j ) = Tr ( Y 2 ) - n ≥ n 2 / k - n . Al dividir por n ( n −1), obtenemos que el valor objetivo es al menos ( n / k - 1) / ( n −1).
En particular, cuando n = k +1, la respuesta de daniello está dentro de un factor de 2 desde el valor óptimo.
¿Cuándo es alcanzable este límite inferior?
La consecución de este límite inferior ( n / k - 1) / ( n -1) es equivalente a hacer Y = ( n / k ) I . No sé la caracterización exacta cuando es posible, pero existen las siguientes condiciones:
- Cuando n = k +1, se puede obtener considerando k +1 vectores unitarios que forman un k -simplex regular centrado en el origen, mejorando de 2 / ( k ( k +1)) en la respuesta de daniello a 1 / k óptimo 2 .
- Cuando n es un múltiplo de k , es claramente alcanzable fijando una base ortonormal de ℝ k y asignando cada uno de los vectores de base a n / k de v 1 , ..., v n .
- De manera más general que el último punto, si es alcanzable con alguna opción de k y n = n 1 y n = n 2 , entonces también es alcanzable para el mismo k y n = n 1 + n 2 . En particular, es alcanzable si n = a k + b donde a y b son enteros que satisfacen a ≥ b ≥0.
Aunque no he verificado los detalles, parece que cualquier diseño esférico en 2 proporciona una solución para alcanzar este límite inferior.
Conexión incorrecta a SIC-POVM en información cuántica
En revisiones anteriores, dije:
Sospecho que responder esto completamente es una pregunta difícil. La razón es que si consideramos el espacio vectorial complejo ℂ k , esta pregunta está relacionada con un problema abierto en la información cuántica.
Pero esta relación era incorrecta. Explicaré por qué.
Más precisamente, considere el siguiente problema:
Elija los vectores unitarios x 1 ,…, x n ∈ ℂ k para minimizar (1 / ( n ( n −1))) ∑ i ≠ j | x i * x j | 2 .
El límite inferior anterior se mantiene igualmente en esta versión compleja. Considere el caso donde n = k 2 en la versión compleja. Entonces el límite inferior es igual a 1 / ( k +1).
Hasta ahora, fue correcto.
Un conjunto de k 2 vectores unitarios x 1 , ..., x k 2 ∈ ℂ k que alcanzan el límite inferior se llama SIC-POVM en la dimensión k ,
Esta parte fue incorrecta. Un SIC-POVM es un conjunto de k 2 vectores unitarios x 1 ,…, x n ∈ ℂ k para los cuales | x i * x j | 2 = 1 / ( k +1) para todo i ≠ j . Tenga en cuenta que aquí el requisito debe cumplir para todos los pares i ≠ j , no solo el promedio sobre todos los pares i ≠ j . En la sección "Formulación equivalente", mostramos la equivalencia entre minimizar el máximo y minimizar el promedio, pero esto fue posible porque x 1, ..., x n eran variables aleatorias que tomaban vectores unitarios allí. Aquí x 1 , ..., x n son solo vectores unitarios, por lo que no podemos usar el mismo truco.