¿Es posible acelerar la generación de la matriz de ponderación utilizando un algoritmo cuántico?


9

En este [1] artículo, en la página 2, mencionan que están generando la matriz de ponderación de la siguiente manera:

W=1Md[m=1m=Mx(m)(x(m))T]Idd

donde 's son las muestras de entrenamiento dimensionales (es decir, donde ) y hay muestras de entrenamiento en total. Esta generación de matriz de ponderación utilizando la multiplicación de matriz seguida de una suma sobre términos parece ser una operación costosa en términos de complejidad temporal, es decir, supongo que alrededor de (?).x(m)dx:={x1,x2,...,xd}Txi{1,1}  i{1,2,...,d}MMO(Md)

¿Existe algún algoritmo cuántico que pueda ofrecer una aceleración sustancial para la generación de la matriz de ponderación? Creo que en el documento su aceleración principal proviene del algoritmo de inversión de matriz cuántica (que se menciona más adelante en el documento), pero no parecen haber tenido en cuenta este aspecto de la generación de la matriz de ponderación.

[1]: Una red neuronal de Quantum Hopfield Lloyd et al. (2018)

Respuestas:


5

Tomando la matriz de densidad muchos de los detalles están contenidos en el siguiente párrafo en la página 2:

ρ=W+Idd=1Mm=1M|x(m)x(m)|,

Es crucial para las adaptaciones cuánticas de las redes neuronales la lectura clásica a cuántica de los patrones de activación. En nuestra configuración, leer en un patrón de activación equivale a preparar el estado cuántico . En principio, esto podría lograrse utilizando las técnicas de desarrollo de la memoria cuántica de acceso aleatorio (qRAM) [33] o la preparación eficiente del estado cuántico, para lo cual existen resultados restringidos, basados ​​en oráculo [34]. En ambos casos, la sobrecarga computacional es logarítmica en términos de . Alternativamente, uno puede adaptar una perspectiva totalmente cuántica y tomar los patrones de activaciónx|xd|xdirectamente desde un dispositivo cuántico o como la salida de un canal cuántico. Para el primero, nuestro tiempo de ejecución de preparación es eficiente siempre que el dispositivo cuántico esté compuesto por una cantidad de compuertas que se escalan polinomialmente como máximo con el número de qubits. En cambio, para este último, generalmente vemos el canal como una forma de interacción fija entre el sistema y el entorno que no requiere una sobrecarga computacional para implementarse.

Las referencias en lo anterior son:

[33]: V. Giovannetti, S. Lloyd, L. Maccone, Memoria de acceso aleatorio cuántico, Physical Review Letters 100, 160501 (2008) [ enlace PRL , enlace arXiv ]

[34]: AN Soklakov, R. Schack, preparación eficiente del estado para un registro de bits cuánticos, Physical Review A 73, 012307 (2006). [ Enlace PRA , enlace arXiv ]


Sin entrar en detalles de cómo, los dos anteriores son de hecho esquemas para, respectivamente, implementar una qRAM eficiente; y una preparación eficiente del estado que recrea el estado en el tiempo .|xO(log2d)

Sin embargo, esto solo nos lleva hasta ahora: esto se puede usar para crear el estado, mientras que queremos una suma sobre todas las posibles .ρ(m)=|x(m)x(m)|m

Crucialmente, está mezclado, por lo que no puede representarse por un solo estado puro, por lo que la segunda de las dos referencias anteriores sobre la recreación de estados puros no se aplica y el primero requiere que el estado ya esté en qRAM.ρ=mρ(m)/M

Como tal, los autores hacen uno de tres supuestos posibles:

  1. Tienen un dispositivo que les da el estado de entrada correcto

  2. O tienen los estados en qRAM,ρ(m)

  3. Son capaces de crear esos estados a voluntad, utilizando la segunda de las referencias anteriores. El estado mixto se crea utilizando un canal cuántico (es decir, un mapa de conservación de trazas (CPTP) completamente positivo).

Olvidando las dos primeras opciones anteriores por el momento (la primera resuelve mágicamente el problema de todos modos), el canal podría ser:

  • un sistema de ingeniería, en el sentido de que se crearía para una instancia específica en algo similar a una simulación analógica. En otras palabras, tiene un canal físico que requiere un período de tiempo físico (en oposición a cierta complejidad temporal). Esta es la "interacción fija del sistema y el entorno que no requiere una sobrecarga computacional para implementarse".t

  • El canal en sí mismo es simulado. Hay algunos documentos sobre esto, como la simulación aproximada de canales cuánticos de Bény y Oreshkov ( enlace arXiv ; esto parece un documento completo, pero no pude encontrar ninguna declaración de complejidad temporal), Lu et. Simulación experimental de canales cuánticos de al. (parece que no existe una versión arXiv) y preimpresión arXiv de Wei, Xin y Long Simulación cuántica universal eficiente de canales en la computadora cuántica en la nube de IBM , que (por número de qubits ) da una complejidad temporal de . La dilatación de muelles también se puede utilizar, con una complejidad den=log2dO((8n3+n+1)42n)O(27n343n).


Ahora mirando la opción 2 1 , un posible método más eficiente sería transferir los estados del registro de direcciones al registro de datos en el método habitual: para las direcciones en el registro , , transferir esto al registro de datos proporciona el estado en el registro de datos como . Debería ser posible simplemente decodificar la dirección y el registro de datos para convertir esto en un estado mixto, dando una pequeña sobrecarga de tiempo, aunque sin sobrecarga de complejidad computacional adicional, dando una complejidad mucho mejor de producir , dada una qRAM con los estados , deajψj|jadjψj|ja|Djdρ|x(m)O(n) . Esta es también la complejidad de crear los estados en primer lugar, dando una complejidad potencial (muy mejorada) de producir de .|x(m)ρO(n)

1 Gracias a @glS por señalar esta posibilidad en el chat


Esta matriz de densidad luego se alimenta a 'qHop' (Hopfield cuántico), donde se usa para simular para según la subsección " Simulación Hamiltoniana Eficiente de A " en la página 8.eiAt

A=(WγIdPP0)

como una pequeña nota sobre su edición: realmente no necesita "decohererar" el registro de direcciones, ni hacer nada en realidad. El simple hecho de no usarlo hace que el contenido del registro de datos sea indistinguible de una mezcla de varios|Dj
glS
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.