Skip to Content

Руководство по поведенческой медицине собак и кошек стр.69

Режим прерывистого подкрепления для выработки требуемой поведенческой реакции

Если режим прерывистого подкрепления используют для того, чтобы выработать определенную модель поведения, то первоначально подкрепление производят часто, а затем, как только устанавливается стабильная ответная реакция, начинают применять все реже и реже. Так, на начальном этапе животное поощряют за исполнение любого действия, приближающегося к целевому поведению, а позднее только за наиболее четкое выполнение требований, с тем чтобы его поведение формировалось в заданном направлении. Этот процесс, называемый последовательным приближением, наиболее эффективен в тех случаях, когда в определенный отрезок времени работа ведется только с одним аспектом поведения. Например, если животное учат садиться по команде, то первоначально его вознаграждают каждый раз, когда оно выполняет команду (непрерывное подкрепление); как только ответная реакция становится стабильной, обычно переходят на дифференцированный режим, т.е. поощряют только те случаи, когда животное садится правильно и быстро.

Режим прерывистого подкрепления для подавления нежелательного поведения

Использование режимов прерывистого подкрепления позволяет также снизить частоту некоторых поведенческих проявлений или даже полностью устранить их. Это достигается путем дифференцированного подкрепления ослабленных проявлений проблемного поведения (ДПО), причем для успеха не требуется активного участия животного в программе дрессировки.

При ограниченном ДПО подкрепляется поведение, при котором частота или продолжительность нежелательных проявлений не превышают предварительно заданного уровня. Экспериментально установлено, что некоторые варианты метода позволяют устранять усвоенное нежелательное поведение быстрее, чем простым прекращением подкрепления (Zeiler, 1971).

Этот метод наиболее целесообразно применять на ранних этапах борьбы с чрезмерно громкими голосовыми сигналами животного, особенно если цель данного поведения — привлечь внимание хозяина. Успех зависит от характера голосовых сигналов, а также от того, насколько животное заинтересовано в получаемом от владельца вознаграждении.

•    Первоначально вознаграждаются менее интенсивные проявления, благодаря чему животное быстро понимает, что предпочтительны более мягкие формы поведения.

•    Затем требования становятся строже: поощряется еще более спокойное поведение.

•    Даже после того, как реакции животного станут стабильно менее интенсивными, эту стратегию продолжают до тех пор, пока не достигнут допустимого уровня громкости, либо совсем перестают обращать на проблему внимание.

•    В качестве альтернативы можно использовать раздельное ДПО, при котором подкрепляют реакции, разделенные определенным временным интервалом.

Одна из причин, почему эти методы очень полезны для коррекции некоторых типов поведения, направленного на привлечение внимания, состоит в том, что трудно ожидать от хозяина, чтобы он не обращал внимания на своего питомца каждый раз, когда тот пытается установить контакт,— ведь большинство животных-компаньонов содержат именно ради радости общения с ними. Практичнее попросить владельца ограничивать свое внимание к животному и не проявлять его хотя бы в те минуты, когда животное оставляет его одного.


⇐ вернуться к прочитанному| |перейти на следующую страницу ⇒