Inteligencia artificial

Preguntas y respuestas para personas interesadas en preguntas conceptuales sobre la vida y los desafíos en un mundo donde las funciones "cognitivas" se pueden imitar en un entorno puramente digital.

8
Prueba de que la inteligencia general artificial es posible
Se supone en informática que la mente humana puede replicarse con una máquina de Turing, por lo tanto, es posible la Inteligencia General Artificial (AGI). Asumir lo contrario es creer en algo místico, y las creencias místicas son falsas. No conozco ningún otro argumento de que AGI es posible, y …
11 philosophy  agi  proofs 





1
¿Cómo se pueden aplicar los gradientes de políticas en el caso de múltiples acciones continuas?
Trusted Region Policy Optimization (TRPO) y Proximal Policy Optimization (PPO) son dos algoritmos de gradientes de políticas de vanguardia. Al usar una sola acción continua, normalmente, usaría alguna distribución de probabilidad (por ejemplo, gaussiana) para la función de pérdida. La versión aproximada es: L(θ)=log(P(a1))A,L(θ)=log⁡(P(a1))A,L(\theta) = \log(P(a_1)) A, donde es la …










Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.