Preguntas etiquetadas con reinforcement-learning

Un conjunto de estrategias dinámicas mediante las cuales un algoritmo puede aprender la estructura de un entorno en línea tomando acciones adaptativas asociadas con diferentes recompensas para maximizar las recompensas obtenidas.

2
Preguntas sobre Q-Learning usando redes neuronales
He implementado Q-Learning como se describe en, http://web.cs.swarthmore.edu/~meeden/cs81/s12/papers/MarkStevePaper.pdf Para aprox. P (S, A) Uso una estructura de red neuronal como la siguiente, Activación sigmoidea Entradas, número de entradas + 1 para neuronas de acción (todas las entradas escaladas 0-1) Salidas, salida única. Q-Value N número de M capas ocultas. Método …


1
GAM vs LOESS vs splines
Contexto : Quiero trazar una línea en un diagrama de dispersión que no aparece paramétrico, por lo tanto, estoy usando geom_smooth()en ggploten R. Devuelve automáticamente. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to …












1
¿Se puede entrenar un modelo de P (Y | X) a través del descenso de gradiente estocástico a partir de muestras de P (X) sin iid y muestras de P (Y | X)?
Cuando se entrena un modelo parametrizado (por ejemplo, para maximizar la probabilidad) a través del descenso de gradiente estocástico en algún conjunto de datos, se supone comúnmente que las muestras de entrenamiento se extraen de la distribución de datos de entrenamiento. Entonces, si el objetivo es modelar una distribución conjunta …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.