Карен Прайор - Не рычите на собаку

Отдаю как есть, возможно кому-то пригодится. Одна из немногих хороших книг за последнее время.

  • подкрепления
    • положительное подкрепеление
      • подкрепление-поощрение определенного поведения
      • то что не произошло не подкрепляется
    • отрицательное подкрепление
      • тоже иногда работает но намного хуже
    • есть разница между поведением и подкреплением поведения
      • поведение уже произошло по факту это не изменить
      • отрицательне подкрепление можно остановить
    • время подкрепления
      • Время подкрепления очень важно. Существо должно понимать за что его хвалят или ругают.
      • Если подрепление было отложено то существо не знает за что его похвалили или поругали.
    • величина подкрепления
      • Хвалить нужно чуть чуть иначе наступит скука и зажратость. Должен поддерживаться интерес. Но делать это надо гораздо чаще.
      • Если похвалить один раз много, то то существо получившее награду расслабиться и дальше ничего не будет делать. А если почуть чуть но часто то интерес будет поддерживаться гораздо более долго.
      • Размер зависит от сложности задачи. Чем сложнее задача тем больше вознаграждение.
    • большое вознаграждение
      • Награда в 10раз больше иногда может быть сюрпризом для обьекта что подстегнет поведение, но его можно делать не за что-то конкретное а просто так.
    • условное подкрепление
      • Не обязательно использовать формальное подкрепление в виде рыбки или чего-то. Достаточно бывает условного сигнала на похвалу. Например слова, или звуки или цвета. Это работает так же хорошо как и конкретное подкрепление формальное в виде подарков.
      • По сути это так называемые якоря когда например по музыке приходит воспоминание и настроение.
    • режимы подкрепления
      • Когда только навык нарабатывается подкрепление должно быть регулярным.
      • Когда навык уже сформирован подкрепление должно быть эпизодическим и не равномерным. То есть существо не должно знать когда придет подкрепление, тогда навык не утратится. Это так называемый вариативный режим.
      • Исключение для вариативного режима это тестирование проверка размышление решение.
    • долговременные программы подкрепления
      • Применяется фискированный и вариативный режимы одновременно. Сначала фиксированный потом вариативный.
      • Так же при постановке нового навыка нужно давать подкрепление позитивное именно за старт. Потому что старт самое тяжелое в начале формирования навыка.
    • суеверия
      • Суеверия это случайные подкрепления. Вредны. Разрушаются дополнительными проверками.
      • Чтоб не было суеверий при постановке навыка надо использовать различные условия.
      • Суеверие не должнно быть никак связано с подкреплением.
  • процесс выработки
    • Выработка это процесс изменения поведения по шажкам благодаря подкреплению. Как от одного поведения перейти к другому.
    • последовательность+закономерность
      • 1.последовательность (план)
      • 2.закономерности,правила (как почему и зачем поведение должно подкрепляться)
      • Без первого мы не знаем что делать
      • Без второго срываемся саботируем забиваем
    • 10 правил выработки
      • повышать требование постепенно (чтоб субьект всегда мог выполнить)
      • одно действие в один промежуток времени (работать только над одним чем-то)
      • подкреплять именно данный момент (никаких отложенных подкреплений)
      • вводя новый критерий ослабить старый
      • иметь запас действий в случае успеха
        • если субьект хорошо разивается и быстрее назначенного справилось с действием должен быть запас действий в качестве продолжения, не нужно останавливаться на текущем, нужно знать что подкреплять далее.
      • не менять подходы (можно менять тренеров но не менять тренеровки, чтоб принципы сохранялись)
      • если выработка не работает брать другую
      • не заканчивать тренеровку не дав подкрепления (иначе это станет наказанием)
      • если не получается нужно вернуться в детский сад
      • оканчивать тренеровку на высокой ноте (когда все хорошо все получается, иначе не будет желания вернуться к тренеровкам)
    • ускорение формирования (Выработку можно ускорить используя 3 подхода)
      • мишень
        • Мишень это когда мы каким-то образом фокусируем внимание субьекта на каком то обьекте конкретном. Затем перемещая мишень провоцируем обьект следовать за мишенью.
        • Например хлопя по бедру рукой призываем собаку. То есть чтоб существо быстрее поняло что акцентироваться надо на конкретном обьекте-мишени, и взаимодействие с мишенью это важно не просто рандомные события.
      • подражание
        • Показываешь как надо, субьект повторяет. Обычно учатся физические навыки так.
        • Чем меньше словесных обьяснений и больше визуального ряда и примеров, тем быстрее идет обучение через подражание.
      • моделирование
        • Это когда тренер сам ставит субьект или делает им как марионеткой нужные движения, и субьект повторяет то что нужно.
        • Проблема этого подхода в том что так учить очень долго. И более того у субьекта дольше не наступает понимание что ему нужно сделать.
        • Важно понимать что цель обучения не механическое повторение, а именно понимание субьектом что нужно сделать. А моделирование это не обьясняет.
    • формирование поведения у себя
      • трудность в подкреплении себя
        • Основная проблема в том чтоб как-то подкреплять себя потому что исчезает элемент неожиданности. Радости уже мало.
      • не для всех людей подходит самовоспитание
        • Как альтернатива может помочь самовнушение. (гипноз)
      • лучший вариант самоподкрепления это регистрация результатов
        • Таблицы, календари и прочие пираники. Когда человек видит что очередь заданий не пропускается это мотирвирует его и дальше ставить галочки.
      • выработка без слов
        • Возможна выработка на основе любого сигнала если его воспринимает субькет. Цвет, свет, голос, и тд.
    • две ловушки выработки
      • негатив видится яснее чем позитив
      • очень заманчиво болтать об этом
        • Из-за успехов может сложится желание разболтать субьекту о процессе обучения, что нарушит процесс обучения. Понты короче. Необходимо осуществлять формирование поведения а не говорить об этом.
  • управление с помощью стимулов
    • контроль через стимулы осуществляется через 4 условия (каждое из условия нужно прорабатывать отдельно)
      • 1.поведение осуществляется сразу после подачи сигнала
        • сигналом может быть все что воспринимается
        • сигнал может быть заменен новым
          • показываем старый сигнал, потом новый, подкрепляем ответ, со временем делаем старый сигнал слабее
        • сигнал можно сделать едва различимым (стирание симулов)
          • отточеный сигнал постепенно делаем менее интенсивным и в дальнешем хватит едва различимого намека
        • результат стимула это повышенное внимание субьекта (иногда это может происходить даже не осознанно)
        • условные стимулы вызывающие отвращение
          • показываем стимул, если не реагирует то без промежуточных более настойчивых действий сразу дергаем сильно и активно, чтоб подчеркнуть недовольство
        • время отставания
          • для точности ответа на стимул нужно добиваться точного периода ответа
          • подкреплять поведение только нужного временного интервала
        • предвосхищение
          • нет сигнала но субьект уже бросился выполнять в ожидании сигнала
          • вводим таймауты
          • подкреплять только поведение после сигнала
        • поведенческие цепи
          • в этом случае стимул может быть подкреплением
          • серия связанных действий одно за другим
            • например при изучении нового делим изучаемое на части, проходимся, что-то запоминается лучше что-то хуже. двигаемся от сложного к простому, чтоб заканчивать на простом и на позитиве. (похоже на эдванстовский механизм антибарана [[ягодкин николай алгоритм антибарана]] ^antibaran
          • поведенческие цепи рвуться если вклинивается новый не выученный акт или действие не под контролем стимула
        • генерализированно управление
          • если разбивать сложную деятельность на этапы и стимулы делать под каждый этап в итоге субьект осознает что в целом хотят от него и понимает генеральное основное действие тогда действие становится для субьекта простым
          • для людей генерализация проходит намного быстрее т.к. они способны к абстрактному мышлению
        • провалы преднаучения и раздражение
          • иногда субьект вообще ни с того ни с сего перестает реагировть на стимулы
            • при стандартном обучении субьект выучивает сигнал не понимая его
            • потом субьект понимает сам сигнал не сильно концентрируясь на поведении
            • потом субьект понимает и сигнал и что в итоге от него хотят, тогда поведение окончательно закрепляется
          • если субьект не реагирует значит он ошибочно понял что от него хотят и начинает тупить, такой провал для субьекта очень огорчителен
          • нужно терпеливо продолжать пока субьект в итоге не осознает что от него хотят
        • реакция на выученный сигнал всегда сопряжена с усилием субьекта
        • в высшем проявлении этого является дисциплина
      • 2.поведение не возникает при отсутствии стимула
      • 3.поведение не наблюдается в ответ на другие стимулы
      • 4.никакое другое поведение не возникает в ответ на нужый стимул
  • отучение - подкрепление для избавления от поведения
    • метод1 убить зверя (отрицательный метод)
      • реально просто пристрелить, выселить, уволить с работы
      • метод не учит субьекта
    • метод2 наказание (отрицательный метод)
      • чаще всего используется но мало когда приносит пользу
      • одна из причин нерабочести это что наказание по времени не совпадает с событием (не образовыется связь между наказанием и событием)
      • чаще всего ситуация ведет к тому что виновник старается не попадаться
      • чувство вины и стыд это вариант самонаказания
        • стыд и вина стоят на одной ступени с поркой но тоже не эфективны т.к. приходят позже
      • эффект снижается при повторении
    • метод3 отрицательное подкрепление (отрицательный метод)
      • в отличие от метода2 может быть включено в момент действия
        • один человек делает что-то нето, другой хмурит брови, строгий взгляд, замечание
      • так же э#фективно как и положительное подкрепление
      • частое применение отрицательного подкрепления без применения положительного подкрепления приводит к появлению нежелательных черт личности
      • секрет метода в том чтоб сразу прекращать отрицательное подкрепление если поведение субьекта улучшилось хотя бы немного
      • секрет метода в том что субьект это подкрепление воспринимает как результат свои действий
      • на некоторых отрицательное подкрепление не действует (младенцы-дети рождаются чтоб радоваться а не повиноватсья, дикие животные), все одомашненные животные нормально воспринимают отрицательное подкрепление. кошки не очень (возможно потому что наполовину дикие а может потому что симбионт и она как сосед просто делит с нами жилье и питание)
      • единственное отрицательное подкрепление это брызгать ей в моську водой
      • пример использования
        • тормознуть машину пока дети орут, поехать когда затихнут
        • не давать обед пока веши не убраны, убраны обедаем
        • жена бурчит уйти из комнаты, перестала, вернуться в комнату
    • методч4 угашение (отрицательный метод)
      • поведению дают возможность исчезнуть само по себе
      • если поведение не подкреплять реакцией оно может затухнуть само собой
      • привыкание ялвяется способом угашения. если действия не избежать, со временем субьект смирается, реакция на стимул пропадает вообще
      • метод бесполезен если поведение самоподкрепляется
      • пример
        • дети бунтуют, не обращаем внимания, они отстают
        • забастовка
        • человек разбрасывает вещи (смириться, может позврослеет, а может нет)
    • метод5 выработка несовместимого поведения (положительный метод)
      • когда вырабатывается новое поведение не совместимое с нежелательным
      • для спортсменов и владельцев домашних животных
      • хорошо подходит для самого себя для корректировки поведения (печали, грусти, формирования новых привычек)
      • примеры
        • дети бесятся в машине, занять их песнями играми, другим подконтрольным поведением
        • разбрасывает вещи, купить карзину для белья и поощрять складывание туда
        • муж бурчит, волечь в другую активность, интересную или просто активную
        • кто-то ругается, ответить улыбкой приветствием (ломается шаблон)
    • метод6 добиться чтоб поведение вызывалось по сигналу (положительный метод)
      • организм соверщает любое действие в ответ на стимул
      • специально формируем положительный сигнал
      • примеры
        • дети по дороге в цирк слишком шумят. по комманде наоборот начинать максимально беситься пока не станет скучно, нескольких таких повторений достаточно
        • собака ноет что устала гулять и просит запустить. повесить двусторонний диск, черная сторона ни при каких условиях не пускать. белая пускать когда собака попросится.
        • сосед бросает вещи, устроить соревнование по срачельнику, он увидит на сравнении
        • муж приходит бурчащий, выделить время на нытье, вне этого времени не реагировать
        • ленивый работник, выделить время когда можно официально валять дурака
        • кошка лазит на стол, научить ее залезать по комманде, все остальное время вне стола
    • метод7 формирование отсутствия (положительный метод)
      • подкрепляется все что угодно кроме неправильного поведения (избавление от неприятных родственников)
    • метод8 смена мотивации (положительный метод)
      • основной и самый лучши способ
      • нужно выяснять ради чего субьект делает
      • есть внешня а есть внутренняя мотивация, скрытая, вот она доминирует, нужно ее раскрывать
      • некоторое поведение самоподкрепляемое (эффект плацебо)
      • примеры
        • разбрасывает вещи найми уборщицу
        • сабака лает одна выясни почему, страшно или скучно, от этого можно действовать
        • дети шумят, может они устали или голодные
    • преодоление сложных привычек
      • используем комплекс методов
      • важным этапом является тригер, убрать тригер и с привычкой будет гораздо проще работать