Para obtener mejores resultados en el refuerzo positivo a largo plazo, debe proporcionar recompensas de valor variable de alto valor a valor medio a bajo valor sin recompensa. Inicialmente, desea utilizar recompensas de alto valor cuando el comportamiento (o refuerzo positivo en general) es nuevo. Luego, debe cambiar al azar al proporcionar recompensas de alto valor o de bajo valor, pasando gradualmente a una recompensa nula o generalmente de bajo valor por los comportamientos establecidos. Debería ser como una máquina tragamonedas, generalmente no recupera nada o solo unas pocas monedas, pero de vez en cuando, obtiene un gran premio y eso evita que se vuelva aburrido.
No puedo decir en qué parte de la escala de recompensas 'buen perro' se ajusta a su perro. Tenía un perro para el que era una de las recompensas de mayor valor y otro para el que era simplemente el marcador de que podría haber una recompensa (es decir, como las ruedas de la ranura girando). Pero lo importante es el refuerzo variable.
Hay mucha buena información sobre entrenamiento positivo en la página de entrenamiento de Dog Scouts of America