¿Las redes neuronales de aprendizaje profundo se ejecutarán en computadoras cuánticas?


15

Deep Learning (múltiples capas de redes neuronales artificiales utilizadas en tareas de aprendizaje automático supervisadas y no supervisadas) es una herramienta increíblemente poderosa para muchas de las tareas de aprendizaje automático más difíciles: reconocimiento de imágenes, reconocimiento de video, reconocimiento de voz, etc. Dado que actualmente es una de los algoritmos de aprendizaje automático más potentes, y Quantum Computing generalmente se considera como un cambio de juego para ciertas tareas de computación muy difíciles, me pregunto si ha habido algún movimiento al combinar los dos.

  • ¿Podría un algoritmo de aprendizaje profundo ejecutarse en una computadora cuántica?
  • ¿Tiene sentido intentarlo?
  • ¿Existen otros algoritmos cuánticos que harían irrelevante el aprendizaje profundo?

1
No soy un experto, pero imagino que el algoritmo HHL sería útil en este contexto.
DaftWullie

Respuestas:


8
  1. tiempo original

  2. Por el hecho, hay ganancias computacionales claras en algunos procesos: sí.

  3. No que yo sepa. Pero alguien con más experiencia puede sonar aquí si lo desean. Lo único que viene a la mente: a menudo podemos usar el aprendizaje profundo y otras formas de inteligencia artificial para estudiar problemas de química y física porque la simulación es costosa o poco práctica. En este dominio, es probable que las computadoras cuánticas sacrifiquen a sus ancestros clásicos dada su capacidad de simular de forma nativa sistemas cuánticos (como los de la química nuclear) en tiempo real o más rápido.

La última vez que hablé con él, Mario Szegedy estaba interesado precisamente en esto, probablemente hay muchos otros investigadores trabajando también en este momento.


66
No estoy convencido de que el algoritmo de Grover sea relevante aquí. El algoritmo de Grover encuentra la única entrada única que produce exactamente una salida dada. OTOH, las redes neuronales son muy poco únicas por naturaleza, y tampoco son realmente exactas, en el mejor de los casos asintéticamente precisas.
Leftaroundabout

Puede tratarse como un problema de búsqueda en la base de datos al observar una súper posición de todos los estados en los que pueden estar los pesos. Deje que la función de búsqueda devuelva 1, si la norma de la derivada de la red neuronal en una entrada estándar es el peso menos de alguna tolerancia deseada.
frogeyedpeas

1
Eso sería completamente inútil. Para cualquier problema no trivial habrá muchas combinaciones de pesos en los que el gradiente es cero; incluso si el algoritmo de Grover le diera uno de estos, generalmente no sería un mínimo, y mucho menos un mínimo global.
Leftaroundabout

No estoy de acuerdo, teniendo en cuenta el siguiente protocolo: descenso de gradiente de vainilla hasta cierto umbral, luego aplico la búsqueda de Grover entre un espacio muy restringido de pesos para recoger un mínimo duro dentro de algún error, esa parte final es donde el descenso de gradiente generalmente converge muy lentamente hacia el óptimo local, y me da curiosidad saber si recurrir a la búsqueda de Grover podría ser interesante
frogeyedpeas

1
Hm, eso podría funcionar; Sin embargo, en esa parte final, estoy seguro de que también podría hacerlo mucho mejor que el descenso de gradiente con medios clásicos. El gradiente de biconjugado es el candidato obvio.
Leftaroundabout

13

Esta es una pregunta abierta, pero sí, hay una cantidad considerable de trabajo que se está haciendo en este frente.

Algunas aclaraciones

En primer lugar, debe tenerse en cuenta que hay dos formas principales de fusionar el aprendizaje automático (y el aprendizaje profundo en particular) con la mecánica cuántica / computación cuántica:

Aplique técnicas clásicas de aprendizaje automático para abordar los problemas que surgen en el contexto de la mecánica cuántica / información cuántica / computación cuántica . Esta área está creciendo demasiado rápido para que incluso intente una lista decente de referencias, por lo que solo vincularé un par de los trabajos más recientes en esta dirección: en 1803.04114 los autores utilizaron un enfoque de aprendizaje automático para encontrar circuitos para calcular la superposición entre dos estados (hay una serie de otros trabajos en esta misma dirección), y en 1803.05193 los autores estudiaron cómo las redes neuronales profundas se pueden utilizar para encontrar esquemas de corrección de control cuántico.

Estudio de algoritmos cuánticos para analizar grandes datos , que a menudo equivale a buscar " generalizaciones cuánticas " de algoritmos clásicos de aprendizaje automático. Puedes echar un vistazo a esta otra respuesta mía para obtener algunas referencias básicas sobre este tema. Más específicamente para el caso del aprendizaje profundo , en 1412.3489 (acertadamente llamado Quantum Deep Learning ) los autores proponen un método (efectivamente, un algoritmo cuántico) para acelerar generalmente el entrenamiento de máquinas Boltzmann profundas y restringidas . Otra referencia relevante aquí es 1712.05304 , en la cual los autores desarrollan un algoritmo cuántico de baja profundidad para entrenar máquinas cuánticas de Boltzmann. Ver 1708.09757, así como las referencias en la respuesta vinculada, para encontrar muchos más trabajos sobre esto. Tenga en cuenta que la aceleración que se reivindica en estos trabajos puede variar enormemente, desde aceleraciones exponenciales hasta polinomios.

A veces, la aceleración proviene del uso de algoritmos cuánticos para resolver problemas algebraicos lineales particulares (ver, por ejemplo, la Tabla 1 en ( 1707.08561 ), a veces proviene de lo que básicamente equivale al uso de (variaciones de) la búsqueda de Grover, y a veces de otros cosas (pero principalmente estas dos). Citando de Dunjko y Briegel aquí :

Las ideas para mejoras cuánticas para ML pueden clasificarse aproximadamente en dos grupos: a) enfoques que se basan en la búsqueda de Grover y la amplificación de amplitud para obtener aceleraciones hasta cuadráticas, y, b) enfoques que codifican información relevante en amplitudes cuánticas , y que tienen el potencial de incluso mejoras exponenciales. El segundo grupo de enfoques forma quizás la línea de investigación más desarrollada en ML cuántica, y recopila una gran cantidad de herramientas cuánticas, sobre todo álgebra lineal cuántica, utilizada en propuestas de ML cuántica.

Respuesta más directa a las tres preguntas.

Habiendo dicho lo anterior, permítame responder más directamente los tres puntos que planteó:

  1. ¿Podría un algoritmo de aprendizaje profundo ejecutarse en una computadora cuántica? Definitivamente sí: si puedes ejecutar algo en una computadora clásica, puedes hacerlo en computadoras cuánticas. Sin embargo, la pregunta que uno debería hacerse es si un algoritmo cuántico (profundo) de aprendizaje automático puede ser más eficiente que las contrapartes clásicas . La respuesta a esta pregunta es más complicada. Posiblemente sí , hay muchas propuestas en esta dirección, pero es demasiado pronto para decir qué funcionará o no.

  2. ¿Tiene sentido intentarlo? ¡Si!

  3. ¿Existen otros algoritmos cuánticos que harían irrelevante el aprendizaje profundo? Esto depende en gran medida de lo que quiere decir con " irrelevante ". Quiero decir, por lo que se sabe en este momento, puede muy bien haber algoritmos clásicos que harán que el aprendizaje profundo sea "irrelevante".

3
En el contexto de esta respuesta, me gustaría mencionar este artículo reciente que muestra cómo el algoritmo de optimización aproximada cuántica se puede utilizar para entrenar redes neuronales (máquinas de Boltzmann restringidas) mediante el uso de muestreo aproximado de Gibbs en computadoras cuánticas universales.
Mark Fingerhuth

1
@ MarkFingerhuth Lo agregué a la respuesta, gracias por el puntero (¡y bienvenido al sitio!)
glS

2

Aquí hay un último desarrollo de Xanadu, un circuito cuántico fotónico que imita una red neuronal. Este es un ejemplo de una red neuronal que se ejecuta en una computadora cuántica.

Este circuito fotónico contiene interferómetros y compuertas de compresión que imitan las funciones de pesaje de un NN, una compuerta de desplazamiento que actúa como polarización y una transformación no lineal similar a la función ReLU de un NN.

También han utilizado este circuito para entrenar la red para generar estados cuánticos y también implementar puertas cuánticas.

Aquí están su publicación y el código utilizado para entrenar el circuito . Aquí hay un artículo medio que explica su circuito.


2

Todas las respuestas aquí parecen ignorar una limitación práctica fundamental:

Deep Learning específicamente funciona mejor con big data. MNIST tiene 60000 imágenes, ImageNet tiene 14 millones de imágenes.

Mientras tanto, las computadoras cuánticas más grandes en este momento tienen 50 ~ 72 Qbits.

Incluso en los escenarios más optimistas, las computadoras cuánticas que pueden manejar los volúmenes de datos que requerirían algoritmos de aprendizaje profundo en lugar de métodos de modelado más tradicionales no estarán disponibles en el corto plazo.

Por lo tanto, aplicar QC a Deep Learning puede ser una buena curiosidad teórica, pero no algo que pronto será práctico.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.