Кендра Черри, магистр медицины, писатель и консультант по вопросам образования, помогающая студентам изучать психологию.
Статьи Verywell Mind рецензируются сертифицированными врачами и специалистами в области психического здоровья. Медицинские рецензенты подтверждают, что содержание тщательное и точное, отражающее последние исследования, основанные на фактических данных. Контент проверяется перед публикацией и после существенных обновлений. Учить больше.
Дэвид Зусман, доктор философии, является лицензированным клиническим психологом с опытом лечения лиц с психическими заболеваниями и проблемами, связанными с употреблением психоактивных веществ.
Веривелл / Джей Ар Би
Оперантное обусловливание — это процесс обучения, в котором новые модели поведения приобретаются и модифицируются посредством их ассоциации с последствиями. Поощрение поведения увеличивает вероятность его повторения в будущем, в то время как наказание за поведение снижает вероятность его повторения.
В оперантном обусловливании графики подкрепления являются важным компонентом процесса обучения. Когда и как часто мы подкрепляем поведение, это может иметь огромное влияние на силу и скорость реакции.
Что такое график подкрепления?
График подкрепления — это, по сути, правило, определяющее, какие примеры поведения будут подкрепляться. В некоторых случаях поведение может подкрепляться каждый раз, когда оно происходит. Иногда поведение может вообще не подкрепляться.
Как часть оперантного обусловливания может использоваться как положительное, так и отрицательное подкрепление. В обоих случаях цель подкрепления состоит в том, чтобы усилить поведение, чтобы оно, вероятно, повторилось.
Графики подкрепления имеют место как в естественных учебных ситуациях, так и в более структурированных учебных ситуациях. В реальных условиях поведение, вероятно, не будет подкрепляться каждый раз, когда оно происходит. В ситуациях, когда вы намеренно пытаетесь подкрепить определенное действие (например, в школе, спорте или дрессировке животных), вы должны следовать определенному графику подкрепления.
Некоторые расписания лучше подходят для определенных типов тренировочных ситуаций. В некоторых случаях обучение может требовать одного графика, а затем переключаться на другой после того, как желаемое поведение будет обучено. Две основные формы графиков армирования называются непрерывным армированием и частичным армированием.
Непрерывные графики подкрепления
При непрерывном подкреплении желаемое поведение подкрепляется каждый раз, когда оно происходит. Этот график лучше всего использовать на начальных этапах обучения, чтобы создать прочную связь между поведением и реакцией.
Представьте, например, что вы пытаетесь научить собаку пожимать вам руку. На начальных этапах обучения вы будете придерживаться графика непрерывного подкрепления, чтобы научить и закрепить поведение. Это может включать в себя захват лапы собаки, встряхивание ее, произнесение «встряхните», а затем предложение вознаграждения каждый раз, когда вы выполняете эти шаги. В конце концов, собака начнет выполнять действие самостоятельно.
Графики непрерывного подкрепления наиболее эффективны при попытке научить новому поведению. Эти графики обозначают шаблон, в котором за каждым узко определенным ответом следует узко определенное последствие.
Частичные графики армирования
После того, как реакция прочно установится, график непрерывного подкрепления обычно переключается на график частичного подкрепления. При частичном (или прерывистом) подкреплении реакция подкрепляется только часть времени. Выученное поведение усваивается медленнее при частичном подкреплении, но реакция более устойчива к угасанию.
Вспомните предыдущий пример, в котором вы обучали собаку трястись. Хотя изначально вы использовали непрерывное подкрепление, подкреплять поведение каждый раз, спустя долгое время после того, как собака научилась этому трюку, просто нереально. Со временем вы переключитесь на частичное расписание, чтобы обеспечить дополнительное подкрепление после того, как поведение установится или по прошествии значительного времени.
Существует четыре графика частичного подкрепления. Два из них – это графики соотношения, которые основаны на том, сколько ответов произошло. Два других являются интервальными расписаниями или расписаниями, основанными на том, сколько времени прошло.
Эти четыре схемы подкрепления иногда называют FR, VR, FI и VI, что означает фиксированное соотношение, переменное соотношение, фиксированный интервал и переменный интервал.
Расписания с фиксированным соотношением
Схемы с фиксированным соотношением — это те, в которых ответ подкрепляется только после определенного количества ответов. Этот график обеспечивает высокую, устойчивую скорость реакции с короткой паузой после подачи подкрепления. Примером графика с фиксированным соотношением может быть доставка кормовой гранулы крысе после того, как она пять раз нажмет на планку.
Графики с переменным соотношением
Графики с переменным соотношением возникают, когда реакция подкрепляется после непредсказуемого количества ответов. Этот график создает высокую устойчивую скорость реагирования. Азартные игры и лотереи — хорошие примеры вознаграждения, основанного на графике с переменным соотношением. В лабораторных условиях это может включать доставку пищевых гранул крысе после одного нажатия на брусок, снова после четырех нажатий на брусок, а затем снова после двух нажатий на брусок.
Расписания с фиксированным интервалом
Расписания с фиксированным интервалом — это те, в которых первый ответ вознаграждается только по истечении заданного периода времени. Этот график вызывает большое количество реакций ближе к концу интервала, но более медленную реакцию сразу после подачи подкрепления. Примером этого в лабораторных условиях может быть подкрепление крысы лабораторной таблеткой для первого жима штанги по истечении 30-секундного интервала.
Расписания с переменным интервалом
Расписания с переменным интервалом возникают, когда ответ вознаграждается по прошествии непредсказуемого количества времени. Этот график обеспечивает медленную, устойчивую скорость реакции.
Примером этого может быть доставка кормовой гранулы крысе после первого нажатия на штангу после минутного интервала; вторая таблетка для первой реакции после пятиминутного интервала; и третья таблетка для первого ответа после трехминутного интервала.
Частичное расписание | Сроки подкрепления | Скорость отклика |
Фиксированное соотношение (FR) | После определенного количества ответов | Высокий, устойчивый |
Переменное соотношение (VR) | После непредсказуемого количества ответов | Высокий, устойчивый |
Фиксированный интервал (FI) | Через определенное время | Высокая в конце интервала, но медленнее сразу после подачи подкрепления |
Переменный интервал (VI) | После непредсказуемого количества времени | Медленный, устойчивый |
Графики подкрепления и исчезновения
Как только подкрепление прекращается, реакция начинает снижаться. Это называется угасанием или периодом времени, в течение которого реакция продолжается, когда подкрепление больше не применяется. Как правило, фиксированные графики подкрепления более склонны к исчезновению, тогда как переменные графики более устойчивы.
Вымирание может привести к нежелательным побочным эффектам. Один из них называется всплеском реакции, когда реакция временно увеличивается в количестве, величине или продолжительности, прежде чем исчезнуть. Другим является изменчивость реакции, которая часто включает в себя развитие других проблемных форм поведения, чтобы получить ту же реакцию.
Графики армирования Примеры
Графики подкрепления могут применяться в различных условиях. Их можно использовать, например, в образовании, например, для поощрения учащихся после выполнения определенного количества заданий или после определенного периода времени без каких-либо поведенческих проблем.
Примером использования графика подкрепления в сценарии воспитания является приучение ребенка к горшку. Вы можете начать с того, что давайте ребенку конфету каждый раз, когда он ходит на горшок (фиксированное соотношение). Затем вы можете перейти на поощрение только после использования горшка несколько дней подряд (с фиксированным или переменным интервалом).
Графики подкрепления также можно использовать в прикладном поведенческом анализе или ABA. В этом случае подкрепление используется для улучшения определенного типа поведения. Например, исследования показали, что эти графики могут быть полезны для помощи людям с интеллектуальными трудностями или проблемами в развитии улучшить коммуникативное поведение.
Использование соответствующего расписания
Решение о том, когда подкреплять поведение, может зависеть от ряда факторов. В тех случаях, когда вы специально пытаетесь научить новому поведению, непрерывный график часто является хорошим выбором. После того, как поведение было изучено, часто предпочтительнее переход на неполный график.
В повседневной жизни частичные режимы подкрепления встречаются гораздо чаще, чем непрерывные. Например, представьте, если бы вы получали вознаграждение каждый раз, когда приходили на работу вовремя. Со временем вместо того, чтобы вознаграждение было положительным подкреплением, отказ в вознаграждении можно было рассматривать как отрицательное наказание.
Вместо этого такие награды обычно распределяются по гораздо менее предсказуемому графику частичного подкрепления. Мало того, что они намного более реалистичны, но они также имеют тенденцию давать более высокую скорость отклика, будучи менее подверженными исчезновению.
Частичные расписания снижают риск пресыщения после того, как поведение было установлено. Если награда дается без конца, субъект может прекратить выполнять поведение, если награда больше не нужна или не нужна.
Например, представьте, что вы пытаетесь научить собаку сидеть. Если вы каждый раз используете еду в качестве поощрения, собака может перестать работать, как только она насытится. В таких случаях что-то вроде похвалы или внимания может быть более эффективным для закрепления уже установившегося поведения.
Слово от Verywell
Оперантное обусловливание может быть мощным инструментом обучения. Графики подкрепления, используемые в процессе обучения и поддержания, могут иметь большое влияние на то, как быстро усваивается поведение, сила реакции и частота проявления поведения.
Чтобы определить, какой график предпочтительнее, рассмотрите различные аспекты ситуации, включая тип поведения, которому обучают, и тип желаемой реакции.
Verywell Mind использует только высококачественные источники, в том числе рецензируемые исследования, для подтверждения фактов в наших статьях. Прочтите наш редакционный процесс, чтобы узнать больше о том, как мы проверяем факты и делаем наш контент точным, надежным и заслуживающим доверия.
Трамп К.Э., Айрес К.М., Куинленд К.К., Забала К.А. Дифференциальное подкрепление без угасания: обзор литературы. Поведение анальной Res Практика. 2020;20(2):94-107. doi:10.1037/bar0000169
Невид Дж. Основы психологии: концепции и приложения. Cengage Learning.
Кендра Черри
Кендра Черри, магистр медицины, писатель и консультант по вопросам образования, помогающая студентам изучать психологию.
Положительное и отрицательное подкрепление в оперантном обусловливании
Кендра Черри, магистр медицины, писатель и консультант по вопросам образования, помогающая студентам изучать психологию.
Статьи Verywell Mind рецензируются сертифицированными врачами и специалистами в области психического здоровья. Медицинские рецензенты подтверждают, что содержание тщательное и точное, отражающее последние исследования, основанные на фактических данных. Контент проверяется перед публикацией и после существенных обновлений. Учить больше.
Дэвид Зусман, доктор философии, является лицензированным клиническим психологом с опытом лечения лиц с психическими заболеваниями и проблемами, связанными с употреблением психоактивных веществ.
Один из множества различных способов, которыми люди учатся, — это процесс, называемый оперантным обусловливанием, также известный как инструментальное обусловливание. Подкрепление в оперантном обусловливании включает усиление действия путем связывания его с последствием.
Например, если вы хотите, чтобы ребенок убирался в своей комнате, вы можете поощрять его поведение, давая ему разрешение каждый раз, когда он это делает. Получая одно и то же последствие (деньги) каждый раз, когда они выполняют действие (уборка комнаты), они начинают учиться этому поведению.
Используемый тип подкрепления может играть важную роль в том, как быстро усваивается поведение, и в общей силе результирующей реакции.
Понимание подкрепления
В оперантном обусловливании «подкрепление» относится ко всему, что увеличивает вероятность возникновения реакции. Психолог Б. Ф. Скиннер ввел этот термин в 1937 г.
Например, поощрение может включать похвалу (поощрение) сразу после того, как ребенок уберет свои игрушки (реакция). Подкрепляя желаемое поведение похвалой, ребенок с большей вероятностью снова выполнит то же действие в будущем.
Подкрепление может включать в себя все, что усиливает или усиливает поведение. Например, в классной комнате типы поощрения могут включать в себя похвалу, освобождение учащихся от нежелательной работы или предоставление символических наград, конфет, дополнительного времени для игр или веселых занятий.
Первичное и вторичное армирование
Подкрепления могут быть как первичными, так и вторичными.
Первичное подкрепление
Первичное подкрепление, которое иногда называют безусловным подкреплением, происходит естественным образом. Первичные подкрепления часто имеют эволюционную основу, поскольку помогают выживанию вида. Таким образом, они не требуют обучения, чтобы работать.
Примеры первичных подкреплений включают в себя:
Генетика также может играть роль в первичном подкреплении. Например, исследования показывают, что люди могут выбирать себе пару частично из-за определенных генетических черт, которые они считают более предпочтительными.
Вторичное подкрепление
Вторичное подкрепление включает в себя стимулы, которые стали полезными в сочетании с другим подкрепляющим стимулом. Это также известно как условное подкрепление.
Например, при дрессировке собаки в качестве основных поощрений можно использовать похвалу и угощение. К похвале и лакомству можно добавить звук кликера в качестве вторичного подкрепления. В конце концов звук кликера сам по себе начинает работать как подкрепление.
Положительное и отрицательное подкрепление
В оперантном обусловливании есть два разных типа подкрепления (помимо первичного и вторичного подкрепления). Оба влияют на поведение, но по-разному. Два типа:
-
: это включает добавить что-то, чтобы усилить реакцию, например, дать ребенку конфету после того, как он убрал свою комнату. : это включает удаление что-то, чтобы повысить отклик, например, отменить тест, если учащиеся сдадут все свои домашние задания за неделю. Удалив аверсивный стимул (тест), учитель надеется усилить желаемое поведение (выполнение всех домашних заданий).
Хотя эти термины включают в себя слова положительный и отрицательный, важно отметить, что Скиннер не использовал их для обозначения «хороший» или «плохой». Вместо этого подумайте, что эти термины будут означать при математическом использовании.
Положительный эквивалент знака «плюс», означающего, что что-то добавляется к ситуации или применяется к ней. Минус эквивалентен знаку минус, что означает, что что-то удаляется или вычитается из ситуации.
Реальные примеры подкрепления
Вот несколько реальных примеров того, как подкрепление можно использовать для изменения поведения.
Положительное подкрепление
Во время тренировки вашей офисной команды по софтболу тренер кричит: «Отличная работа!» после того, как вы бросите шаг. Из-за этого у вас больше шансов снова подать мяч таким же образом. Это пример положительного подкрепления.
Другой пример: находясь на работе, вы превышаете месячную квоту продаж вашего менеджера, поэтому вы получаете премию как часть своей зарплаты. Это повышает вероятность того, что вы снова попытаетесь превысить минимальную квоту продаж в следующем месяце.
Отрицательное подкрепление
Вы идете к врачу и делаете ежегодную прививку от гриппа, чтобы не заболеть гриппом. В этом случае вы совершаете действие (делаете укол), чтобы избежать аверсивного стимула (заболеть). Это пример отрицательного подкрепления.
Другой пример: вы наносите гель алоэ вера на место солнечного ожога, чтобы предотвратить боль от ожога. Применение геля предотвращает неприятный результат (боль), так что это пример отрицательного подкрепления. Поскольку такое поведение сводит к минимуму неприятный результат, вы также с большей вероятностью снова будете использовать гель алоэ вера в будущем.
Подкрепление и сила реакции
То, как и когда предоставляется подкрепление, может повлиять на общую силу реакции. Следующие качества могут измерять и описывать силу реакции:
- точность: Дало ли подкрепление желаемую реакцию?
- Длительность : Как долго продолжался ответ?
- частота: Как часто происходил ответ?
- Настойчивость: Ответ происходил каждый раз?
Графики подкрепления
Моментом подачи подкрепления можно управлять. На ранних этапах обучения часто используется непрерывное подкрепление. Это включает в себя подкрепление реакции каждый раз, когда она возникает, например, давать щенку лакомство каждый раз, когда он писает на улице.
После того, как поведение было приобретено, можно использовать график частичного подкрепления. К четырем основным типам частичного армирования относятся:
-
: подкрепление поведения по истечении определенного периода времени. : Подкрепление поведения после того, как произошло определенное количество ответов. : подкрепление поведения по истечении непредсказуемого периода времени. : Подкрепление поведения после непредсказуемого количества ответов.
Слово от Verywell
Подкрепление играет жизненно важную роль в процессе оперантного обусловливания. При правильном использовании это может быть эффективным инструментом обучения для поощрения желательного поведения и предотвращения нежелательного.
Важно помнить, что то, что представляет собой подкрепление, может варьироваться от одного человека к другому. В классе, например, один ребенок может найти угощение подкрепляющим, в то время как другой может быть безразличен к такой награде. И если ребенок получает внимание от родителей только тогда, когда его ругают, это внимание может фактически усилить плохое поведение.
Узнав больше о том, как работает подкрепление, вы сможете лучше понять, как различные типы подкрепления влияют на обучение и поведение.
Verywell Mind использует только высококачественные источники, в том числе рецензируемые исследования, для подтверждения фактов в наших статьях. Прочтите наш редакционный процесс, чтобы узнать больше о том, как мы проверяем факты и делаем наш контент точным, надежным и заслуживающим доверия.
Стаддон Дж. Э., Черутти Д. Т. Оперантного кондиционирования. Annu Rev Psychol. 2003;54:115-144. doi:10.1146/annurev.psych.54.101601.145124