Отдаю как есть, возможно кому-то пригодится. Одна из немногих хороших книг за последнее время.
- подкрепления
- положительное подкрепеление
- подкрепление-поощрение определенного поведения
- то что не произошло не подкрепляется
- отрицательное подкрепление
- тоже иногда работает но намного хуже
- есть разница между поведением и подкреплением поведения
- поведение уже произошло по факту это не изменить
- отрицательне подкрепление можно остановить
- время подкрепления
- Время подкрепления очень важно. Существо должно понимать за что его хвалят или ругают.
- Если подрепление было отложено то существо не знает за что его похвалили или поругали.
- величина подкрепления
- Хвалить нужно чуть чуть иначе наступит скука и зажратость. Должен поддерживаться интерес. Но делать это надо гораздо чаще.
- Если похвалить один раз много, то то существо получившее награду расслабиться и дальше ничего не будет делать. А если почуть чуть но часто то интерес будет поддерживаться гораздо более долго.
- Размер зависит от сложности задачи. Чем сложнее задача тем больше вознаграждение.
- большое вознаграждение
- Награда в 10раз больше иногда может быть сюрпризом для обьекта что подстегнет поведение, но его можно делать не за что-то конкретное а просто так.
- условное подкрепление
- Не обязательно использовать формальное подкрепление в виде рыбки или чего-то. Достаточно бывает условного сигнала на похвалу. Например слова, или звуки или цвета. Это работает так же хорошо как и конкретное подкрепление формальное в виде подарков.
- По сути это так называемые якоря когда например по музыке приходит воспоминание и настроение.
- режимы подкрепления
- Когда только навык нарабатывается подкрепление должно быть регулярным.
- Когда навык уже сформирован подкрепление должно быть эпизодическим и не равномерным. То есть существо не должно знать когда придет подкрепление, тогда навык не утратится. Это так называемый вариативный режим.
- Исключение для вариативного режима это тестирование проверка размышление решение.
- долговременные программы подкрепления
- Применяется фискированный и вариативный режимы одновременно. Сначала фиксированный потом вариативный.
- Так же при постановке нового навыка нужно давать подкрепление позитивное именно за старт. Потому что старт самое тяжелое в начале формирования навыка.
- суеверия
- Суеверия это случайные подкрепления. Вредны. Разрушаются дополнительными проверками.
- Чтоб не было суеверий при постановке навыка надо использовать различные условия.
- Суеверие не должнно быть никак связано с подкреплением.
- положительное подкрепеление
- процесс выработки
- Выработка это процесс изменения поведения по шажкам благодаря подкреплению. Как от одного поведения перейти к другому.
- последовательность+закономерность
- 1.последовательность (план)
- 2.закономерности,правила (как почему и зачем поведение должно подкрепляться)
- Без первого мы не знаем что делать
- Без второго срываемся саботируем забиваем
- 10 правил выработки
- повышать требование постепенно (чтоб субьект всегда мог выполнить)
- одно действие в один промежуток времени (работать только над одним чем-то)
- подкреплять именно данный момент (никаких отложенных подкреплений)
- вводя новый критерий ослабить старый
- иметь запас действий в случае успеха
- если субьект хорошо разивается и быстрее назначенного справилось с действием должен быть запас действий в качестве продолжения, не нужно останавливаться на текущем, нужно знать что подкреплять далее.
- не менять подходы (можно менять тренеров но не менять тренеровки, чтоб принципы сохранялись)
- если выработка не работает брать другую
- не заканчивать тренеровку не дав подкрепления (иначе это станет наказанием)
- если не получается нужно вернуться в детский сад
- оканчивать тренеровку на высокой ноте (когда все хорошо все получается, иначе не будет желания вернуться к тренеровкам)
- ускорение формирования (Выработку можно ускорить используя 3 подхода)
- мишень
- Мишень это когда мы каким-то образом фокусируем внимание субьекта на каком то обьекте конкретном. Затем перемещая мишень провоцируем обьект следовать за мишенью.
- Например хлопя по бедру рукой призываем собаку. То есть чтоб существо быстрее поняло что акцентироваться надо на конкретном обьекте-мишени, и взаимодействие с мишенью это важно не просто рандомные события.
- подражание
- Показываешь как надо, субьект повторяет. Обычно учатся физические навыки так.
- Чем меньше словесных обьяснений и больше визуального ряда и примеров, тем быстрее идет обучение через подражание.
- моделирование
- Это когда тренер сам ставит субьект или делает им как марионеткой нужные движения, и субьект повторяет то что нужно.
- Проблема этого подхода в том что так учить очень долго. И более того у субьекта дольше не наступает понимание что ему нужно сделать.
- Важно понимать что цель обучения не механическое повторение, а именно понимание субьектом что нужно сделать. А моделирование это не обьясняет.
- мишень
- формирование поведения у себя
- трудность в подкреплении себя
- Основная проблема в том чтоб как-то подкреплять себя потому что исчезает элемент неожиданности. Радости уже мало.
- не для всех людей подходит самовоспитание
- Как альтернатива может помочь самовнушение. (гипноз)
- лучший вариант самоподкрепления это регистрация результатов
- Таблицы, календари и прочие пираники. Когда человек видит что очередь заданий не пропускается это мотирвирует его и дальше ставить галочки.
- выработка без слов
- Возможна выработка на основе любого сигнала если его воспринимает субькет. Цвет, свет, голос, и тд.
- трудность в подкреплении себя
- две ловушки выработки
- негатив видится яснее чем позитив
- очень заманчиво болтать об этом
- Из-за успехов может сложится желание разболтать субьекту о процессе обучения, что нарушит процесс обучения. Понты короче. Необходимо осуществлять формирование поведения а не говорить об этом.
- управление с помощью стимулов
- контроль через стимулы осуществляется через 4 условия (каждое из условия нужно прорабатывать отдельно)
- 1.поведение осуществляется сразу после подачи сигнала
- сигналом может быть все что воспринимается
- сигнал может быть заменен новым
- показываем старый сигнал, потом новый, подкрепляем ответ, со временем делаем старый сигнал слабее
- сигнал можно сделать едва различимым (стирание симулов)
- отточеный сигнал постепенно делаем менее интенсивным и в дальнешем хватит едва различимого намека
- результат стимула это повышенное внимание субьекта (иногда это может происходить даже не осознанно)
- условные стимулы вызывающие отвращение
- показываем стимул, если не реагирует то без промежуточных более настойчивых действий сразу дергаем сильно и активно, чтоб подчеркнуть недовольство
- время отставания
- для точности ответа на стимул нужно добиваться точного периода ответа
- подкреплять поведение только нужного временного интервала
- предвосхищение
- нет сигнала но субьект уже бросился выполнять в ожидании сигнала
- вводим таймауты
- подкреплять только поведение после сигнала
- поведенческие цепи
- в этом случае стимул может быть подкреплением
- серия связанных действий одно за другим
- например при изучении нового делим изучаемое на части, проходимся, что-то запоминается лучше что-то хуже. двигаемся от сложного к простому, чтоб заканчивать на простом и на позитиве. (похоже на эдванстовский механизм антибарана [[ягодкин николай алгоритм антибарана]] ^antibaran
- поведенческие цепи рвуться если вклинивается новый не выученный акт или действие не под контролем стимула
- генерализированно управление
- если разбивать сложную деятельность на этапы и стимулы делать под каждый этап в итоге субьект осознает что в целом хотят от него и понимает генеральное основное действие тогда действие становится для субьекта простым
- для людей генерализация проходит намного быстрее т.к. они способны к абстрактному мышлению
- провалы преднаучения и раздражение
- иногда субьект вообще ни с того ни с сего перестает реагировть на стимулы
- при стандартном обучении субьект выучивает сигнал не понимая его
- потом субьект понимает сам сигнал не сильно концентрируясь на поведении
- потом субьект понимает и сигнал и что в итоге от него хотят, тогда поведение окончательно закрепляется
- если субьект не реагирует значит он ошибочно понял что от него хотят и начинает тупить, такой провал для субьекта очень огорчителен
- нужно терпеливо продолжать пока субьект в итоге не осознает что от него хотят
- иногда субьект вообще ни с того ни с сего перестает реагировть на стимулы
- реакция на выученный сигнал всегда сопряжена с усилием субьекта
- в высшем проявлении этого является дисциплина
- 2.поведение не возникает при отсутствии стимула
- 3.поведение не наблюдается в ответ на другие стимулы
- 4.никакое другое поведение не возникает в ответ на нужый стимул
- 1.поведение осуществляется сразу после подачи сигнала
- контроль через стимулы осуществляется через 4 условия (каждое из условия нужно прорабатывать отдельно)
- отучение - подкрепление для избавления от поведения
- метод1 убить зверя (отрицательный метод)
- реально просто пристрелить, выселить, уволить с работы
- метод не учит субьекта
- метод2 наказание (отрицательный метод)
- чаще всего используется но мало когда приносит пользу
- одна из причин нерабочести это что наказание по времени не совпадает с событием (не образовыется связь между наказанием и событием)
- чаще всего ситуация ведет к тому что виновник старается не попадаться
- чувство вины и стыд это вариант самонаказания
- стыд и вина стоят на одной ступени с поркой но тоже не эфективны т.к. приходят позже
- эффект снижается при повторении
- метод3 отрицательное подкрепление (отрицательный метод)
- в отличие от метода2 может быть включено в момент действия
- один человек делает что-то нето, другой хмурит брови, строгий взгляд, замечание
- так же э#фективно как и положительное подкрепление
- частое применение отрицательного подкрепления без применения положительного подкрепления приводит к появлению нежелательных черт личности
- секрет метода в том чтоб сразу прекращать отрицательное подкрепление если поведение субьекта улучшилось хотя бы немного
- секрет метода в том что субьект это подкрепление воспринимает как результат свои действий
- на некоторых отрицательное подкрепление не действует (младенцы-дети рождаются чтоб радоваться а не повиноватсья, дикие животные), все одомашненные животные нормально воспринимают отрицательное подкрепление. кошки не очень (возможно потому что наполовину дикие а может потому что симбионт и она как сосед просто делит с нами жилье и питание)
- единственное отрицательное подкрепление это брызгать ей в моську водой
- пример использования
- тормознуть машину пока дети орут, поехать когда затихнут
- не давать обед пока веши не убраны, убраны обедаем
- жена бурчит уйти из комнаты, перестала, вернуться в комнату
- в отличие от метода2 может быть включено в момент действия
- методч4 угашение (отрицательный метод)
- поведению дают возможность исчезнуть само по себе
- если поведение не подкреплять реакцией оно может затухнуть само собой
- привыкание ялвяется способом угашения. если действия не избежать, со временем субьект смирается, реакция на стимул пропадает вообще
- метод бесполезен если поведение самоподкрепляется
- пример
- дети бунтуют, не обращаем внимания, они отстают
- забастовка
- человек разбрасывает вещи (смириться, может позврослеет, а может нет)
- метод5 выработка несовместимого поведения (положительный метод)
- когда вырабатывается новое поведение не совместимое с нежелательным
- для спортсменов и владельцев домашних животных
- хорошо подходит для самого себя для корректировки поведения (печали, грусти, формирования новых привычек)
- примеры
- дети бесятся в машине, занять их песнями играми, другим подконтрольным поведением
- разбрасывает вещи, купить карзину для белья и поощрять складывание туда
- муж бурчит, волечь в другую активность, интересную или просто активную
- кто-то ругается, ответить улыбкой приветствием (ломается шаблон)
- метод6 добиться чтоб поведение вызывалось по сигналу (положительный метод)
- организм соверщает любое действие в ответ на стимул
- специально формируем положительный сигнал
- примеры
- дети по дороге в цирк слишком шумят. по комманде наоборот начинать максимально беситься пока не станет скучно, нескольких таких повторений достаточно
- собака ноет что устала гулять и просит запустить. повесить двусторонний диск, черная сторона ни при каких условиях не пускать. белая пускать когда собака попросится.
- сосед бросает вещи, устроить соревнование по срачельнику, он увидит на сравнении
- муж приходит бурчащий, выделить время на нытье, вне этого времени не реагировать
- ленивый работник, выделить время когда можно официально валять дурака
- кошка лазит на стол, научить ее залезать по комманде, все остальное время вне стола
- метод7 формирование отсутствия (положительный метод)
- подкрепляется все что угодно кроме неправильного поведения (избавление от неприятных родственников)
- метод8 смена мотивации (положительный метод)
- основной и самый лучши способ
- нужно выяснять ради чего субьект делает
- есть внешня а есть внутренняя мотивация, скрытая, вот она доминирует, нужно ее раскрывать
- некоторое поведение самоподкрепляемое (эффект плацебо)
- примеры
- разбрасывает вещи найми уборщицу
- сабака лает одна выясни почему, страшно или скучно, от этого можно действовать
- дети шумят, может они устали или голодные
- преодоление сложных привычек
- используем комплекс методов
- важным этапом является тригер, убрать тригер и с привычкой будет гораздо проще работать
- метод1 убить зверя (отрицательный метод)