Preguntas etiquetadas con proofs

2
¿Por qué el Q-learning no converge cuando se usa la aproximación de funciones?
El algoritmo de aprendizaje Q tabular está garantizado para encontrar la función QQQ óptima , Q∗Q∗Q^* , siempre que las siguientes condiciones (lascondiciones Robbins-Monro) con respecto a la tasa de aprendizaje se satisfacen ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)&lt;∞∑tαt2(s,a)&lt;∞\sum_{t} \alpha_t^2(s, a) < \infty donde αt(s,a)αt(s,a)\alpha_t(s, a) significa la tasa de …

8
Prueba de que la inteligencia general artificial es posible
Se supone en informática que la mente humana puede replicarse con una máquina de Turing, por lo tanto, es posible la Inteligencia General Artificial (AGI). Asumir lo contrario es creer en algo místico, y las creencias místicas son falsas. No conozco ningún otro argumento de que AGI es posible, y …
11 philosophy  agi  proofs 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.