Un extraño al campo ML / DL; comenzó el curso Udacity Deep Learning que se basa en Tensorflow; haciendo la tarea 3 problema 4; tratando de ajustar la velocidad de aprendizaje con la siguiente configuración:
- Tamaño de lote 128
- Número de pasos: suficiente para llenar 2 épocas
- Tamaños de capas ocultas: 1024, 305, 75
- Inicialización de peso: truncada normal con estándar. desviación de sqrt (2 / n) donde n es el tamaño de la capa anterior
- Probabilidad de abandono: 0.75
- Regularización: no aplicada
- Algoritmo de velocidad de aprendizaje: decaimiento exponencial
jugado con parámetros de velocidad de aprendizaje; no parecen tener efecto en la mayoría de los casos; código aquí ; resultados:
Accuracy learning_rate decay_steps decay_rate staircase
93.7 .1 3000 .96 True
94.0 .3 3000 .86 False
94.0 .3 3000 .96 False
94.0 .3 3000 .96 True
94.0 .5 3000 .96 True
- ¿Cómo debo ajustar sistemáticamente la tasa de aprendizaje?
- ¿Cómo se relaciona la tasa de aprendizaje con la cantidad de pasos?