Inteligencia artificial proofs

2

¿Por qué el Q-learning no converge cuando se usa la aproximación de funciones?

El algoritmo de aprendizaje Q tabular está garantizado para encontrar la función QQQ óptima , Q∗Q∗Q^* , siempre que las siguientes condiciones (lascondiciones Robbins-Monro) con respecto a la tasa de aprendizaje se satisfacen ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)<∞∑tαt2(s,a)<∞\sum_{t} \alpha_t^2(s, a) < \infty donde αt(s,a)αt(s,a)\alpha_t(s, a) significa la tasa de …

12 reinforcement-learning q-learning deep-rl proofs function-approximation

8

Prueba de que la inteligencia general artificial es posible

Se supone en informática que la mente humana puede replicarse con una máquina de Turing, por lo tanto, es posible la Inteligencia General Artificial (AGI). Asumir lo contrario es creer en algo místico, y las creencias místicas son falsas. No conozco ningún otro argumento de que AGI es posible, y …

11 philosophy agi proofs

1

¿Cuáles son las implicaciones del teorema "Sin almuerzo gratis" para el aprendizaje automático?

El teorema de No Free Lunch (NFL) establece (ver el artículo Coevolutionary Free Lunches de David H. Wolpert y William G. Macready) dos algoritmos son equivalentes cuando su rendimiento se promedia en todos los posibles problemas ¿Es realmente cierto el teorema "Sin almuerzo gratis"? ¿Qué significa en realidad? Un buen …

10 machine-learning optimization proofs no-free-lunch

Preguntas etiquetadas con proofs