Refuerzo negativo: ¿cómo reemplazar un objeto?

18

Mi Beauce Shepherd ahora tiene 9 meses, hemos seguido algunas clases de educación conductual con un entrenador personal y todo salió muy bien. Antes de que el perro hiciera lo que quería y ahora, ¡solo escucha muy bien!

A sugerencia del entrenador, algunos comportamientos se reforzaron positivamente y otros negativamente. El problema que tenemos ahora es con los comportamientos que reforzamos negativamente. Estamos usando una caja de metal para hacer un sonido, el perro lo odia y obedece. Siempre se usa después de un "no" como segunda sanción. Todo funciona a la perfección, y ahora ya no necesitamos usar la caja ya que se comporta correctamente.

El problema es que creemos que tendremos que reemplazar la caja con algo más, ya que ahora aprendió que si no tenemos la caja, no habrá ningún sonido, por lo que se involucra en el comportamiento no deseado. Está comenzando a ser un problema ya que necesitamos llevar la caja a todas partes ahora, porque si no la tenemos, utilizará la oportunidad.

¿Hay alguna manera de rectificar esto reemplazando la caja con nuestro cuerpo o algo así?

Nota: Hace un mes que lo desextrajeron y nos está desafiando un poco menos, pero aún lo hace cuando no tenemos la caja a mano.

Gracias

dogs behavior training

— Salketer
fuente

1

Probablemente deberías hacerle esta pregunta a tu entrenador, pero una vez que el refuerzo negativo (caja de metal) funcionó para frenar su comportamiento no deseado, ¿no deberías comenzar a reforzar los buenos comportamientos? Como ejemplo, si mi perro seguía subiendo al sofá, podría (1) sacudir la caja de metal para desalentarlo, y luego, una vez que descubriera que ir al sofá no era deseado, (2) alabaría y trataría generosamente cada vez que él acostado en el piso cerca del sofá o similar.

— Steve D

1

:) Me encanta cómo los perros pueden aprender esas cosas por sí mismos, después de algunas observaciones ... "¡sin caja, oye, puedo hacer lo que quiera!" :) :) :)

— woliveirajr

10

Siempre que se habla de condicionamiento operante , ayuda hablar el mismo idioma

Refuerzo: Una acción diseñada para aumentar la frecuencia de un comportamiento.
Castigo: una acción diseñada para disminuir la frecuencia de un comportamiento
Positivo: presencia de un estímulo
Negativo: ausencia de un estímulo

Estos términos pueden formar cuatro combinaciones diferentes ( Nota: ¡Los ejemplos entre paréntesis son ejemplos, no consejos!):

Refuerzo positivo: presente un estímulo para aumentar la frecuencia de un comportamiento (p. Ej., Dele un premio cuando el perro se sienta a la orden)
Refuerzo negativo: elimine un estímulo para aumentar la frecuencia de un comportamiento (por ejemplo, el cartero se va después de que el perro ladra)
Castigo positivo: presente un estímulo para disminuir la frecuencia de un comportamiento (por ejemplo, golpear al perro cuando orina en la alfombra)
Castigo negativo: eliminar un estímulo para disminuir la frecuencia de un comportamiento (por ejemplo, salir de la habitación cuando el perro salta sobre ti)

En la práctica, estos pueden confundirse. Por ejemplo, hacer ruido con la caja es un estímulo diseñado para disminuir la frecuencia de un comportamiento, por lo que técnicamente es un ejemplo de castigo positivo, pero si detiene el ruido una vez que el perro realiza el comportamiento correcto, también elimina un estímulo para aumente la frecuencia del comportamiento correcto, ¡hey presto !, refuerzo negativo.

Pero eso presupone que su perro tiene un comportamiento correcto. No especifica cuál es el comportamiento no deseado, o si hay un comportamiento alternativo deseado que está tratando de reforzar. Si todo lo que haces con el ruido es tratar de evitar que haga algo, entonces estás proporcionando castigo en lugar de refuerzo negativo.

En cualquier caso, parte de su problema es probablemente que solo está usando reforzadores y castigadores primarios , es decir, aquellos que el perro no necesita aprender. La comida, por ejemplo, es un reforzador primario. El perro sabe que la comida es buena sin tener que aprenderla. Por extensión, el ruido es un castigo principal, ya que es incómodo para el perro escucharlo. Los reforzadores secundarios y los castigadores, por el contrario, son los que el perro ha aprendido.

El ejemplo clásico es la campana de Pavlov que sonaba cada vez que le daba comida al perro. Al emparejar constantemente un refuerzo primario con un estímulo, el estímulo puede comenzar a actuar como un refuerzo secundario. Es decir, el perro se entera de que la campana señala la llegada de alimentos y reaccionará en consecuencia.

Mencionas que usas la palabra "no" (con suerte con voz severa, los perros son muy hábiles para discernir entonaciones) al regañar a tu perro, junto con el ruido. El "no" debe actuar como un castigo secundario, de la misma manera que el elogio puede funcionar como un refuerzo secundario. Pero probablemente no pudo eliminar gradualmente el ruido real gradualmente, al comenzar a decir a veces "no" pero no hacer el ruido.

El problema es que, a estas alturas, su perro se ha dado cuenta del hecho de que "no" sin recuadro significa que no hay castigador principal, es decir, los dos no están relacionados, y él, por lo tanto, se salva cuando no está cerca.

Le sugiero que abra una nueva pregunta que describa los comportamientos reales que desea desalentar, y podríamos ayudarlo a encontrar una manera de usar todo el espectro de la condición operante para que su perro aprenda lo que quiere. que hacer.

— ThomasH
fuente

5

@ThomasH es una excelente respuesta y toca la cuestión de usar castigadores secundarios de una manera muy precisa.

Aquí solo estoy agregando algunos comentarios sobre dos aspectos del problema.

Castigar el comportamiento incorrecto vs reforzar el comportamiento correcto

Incluso si la "teoría" funciona de la misma manera en el "lado reforzador" y en el "lado castigador" y los efectos pueden ser tan efectivos, no debemos olvidar que suprimir un comportamiento no le enseña al perro qué hacer y centrarse principalmente en La parte "no" del entrenamiento conduce a la microgestión : constantemente debes enseñarle al perro lo que no debe hacer. Incluso si el perro se entera de que no debe hacer X en una situación dada, todavía es libre de realizar Y, Z, etc. Si le enseñas positivamente (lo refuerzas) a hacer W, eso probablemente detendrá algún tipo de círculo vicioso y haz felices a todos.

Refuerzo / castigo de tasa variable

@ThomasH explicó el concepto de refuerzo secundario o castigo.

Un aspecto a tener en cuenta es que, a diferencia de los reforzadores / castigos primarios, los secundarios deben ser recompensados (de una forma u otra) utilizando un horario variable .

La comida es un reforzador primario. Cada vez que el perro toma un pedazo de comida, se refuerza.

Pero una palabra clave como "sí" o un clic puede convertirse en un refuerzo secundario. Está vinculado a un refuerzo primario posterior. El punto clave es que funciona porque el perro aprendió que el reforzador secundario es recompensado por el reforzador primario. Una vez que esto se aprende, el enlace debe mantenerse con recompensas reales. Al principio (durante el entrenamiento) la recompensa vendrá cada vez, luego se puede recompensar con un horario variable. El horario variable en realidad está fortaleciendo el vínculo ya que el perro no puede anticipar cuándo llegará la recompensa principal.

Tenga en cuenta que esto generalmente se aplica a los reforzadores terciarios : la señal "sentarse" es en realidad un reforzador, ya que puede conducir a otro reforzador (un clic, por ejemplo) que luego conduce a una recompensa real.

Por lo general, nunca disociamos el reforzador secundario (el clic) del reforzador primario (por ejemplo, la recompensa alimentaria). Eso mantiene el vínculo entre los dos extremadamente fuertes, y la tasa variable se aplica entre la señal (refuerzo terciario) y el clic.

Sin embargo, en el caso de los castigos, no tiene un "castigo terciario" real, por lo que la tasa variable de "refuerzo" (entendido como castigo en este caso) está entre su castigo secundario ("no") y el castigo real ( la caja).

— Cedric H.
fuente