СибНСХБ

Вид поиска

Область поиска

Найдено в других БД

Формат представления найденных документов:
библиографическое описание	краткий	полный

Отсортировать найденные документы по:
автору	заглавию	году издания	типу документа

Поисковый запрос: (<.>S=МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ<.>)

Общее количество найденных документов : 3
Показаны документы с 1 по 3

РЖ ВИНИТИ 15 (BI44) 13.02-04П1.26

Dezfouli, A.
Habits, action sequences and reinforcement learning [Text] / A. Dezfouli, D. W. Balleine // Eur. J. Neurosci. - 2012. - Vol. 35, N 7. - P1036-1051 . - ISSN 0953-816X
Перевод заглавия: Привычки, последовательность действий и подкрепляемое научение (ПН)
Аннотация: Инструментальные действия могут быть целенаправленными (ЦИД) или продиктованными привычкой (ПИД); первые быстро приобретаются и регулируются результатом, вторые рефлекторны и обусловлены предшествующими стимулами, а не их результатами. Формирование ЦИД часто трактуют как основанное на модели ПН (МПН); эта схема мощна, но плохо объясняет развитие ПИД. Теоретически для формирования привычки необходим другой диспетчер действия, называемый безмодельным ПН (БПН), который формирует не модель мира, а скорее оценку действий в определенных состояниях, позволяя выбрать действие, основанное на истории его подкрепления, а не на результатах. У модели БПН есть прогностические проблемы; основная - неспособность предсказать нечувствительность ПИД к изменениям в обстоятельствах подкрепления действия. Предполагают, что применение схемы БПН в формировании инструментальных действий избыточно, и демонстрируют, что переосмысление привычки как последовательности действий позволяет применить МПН и к ЦИД, и к ПИД. Этот подход имеет существенное значение для методов исследования привычек и позволяет строить новые гипотезы. Австралия, Univ. of Sydney

ГРНТИ	15.21.41

ВИНИТИ 151.21.41.31
Рубрики: ДЕЙСТВИЯ
ИНСТРУМЕНТАЛЬНЫЕ
ЦЕЛЕНАПРАВЛЕННЫЕ
ПРИВЫЧНЫЕ
ФОРМИРОВАНИЕ
МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ

Доп.точки доступа:
Balleine, D.W.

РЖ ВИНИТИ 15 (BI44) 14.02-04П1.47

Learning where to look for a hidden target [Text] / Leanne Chukoskie [et al.] // Proc. Nat. Acad. Sci. USA. - 2013. - Vol. 110, прил. 2. - P10438-10445. - 66 . - ISSN 0027-8424
Перевод заглавия: Научение в поиске скрытой цели
Аннотация: Изучали направление саккадических движений глаз в задачах визуального поиска в зависимости от контекста и условий задачи. Разработана задача поиска нового местоположения невидимой цели, стохастически смещающейся в каждой пробе относительно первоначального положения, в парадигме подкрепляемого научения (ПН). Только в нескольких пробах участники быстро нашли скрытую цель, используя стратегию поиска в области, связанной с предыдущими удачными пробами, и избегания ранее "пустых" мест. Траектория обучения соответствует модели ПН, прогнозирующей чувствительность к недавнему опыту, подтвержденную эмпирически. Кривые научения испытуемых и прогноз согласно модели ПН приближаются к оптимальному функционированию, описываемому теорией идеального наблюдателя. Обсуждают вклад опыта в новой среде в организацию визуального поиска у людей и возможности распространить теорию на другие формы поиска (поиск пищи у животных). США, Univ. of California at San Diego,e-mail: terry@salk.edu

ГРНТИ	15.21.41

ВИНИТИ 151.21.41.31
Рубрики: ПОИСКОВОЕ ПОВЕДЕНИЕ
ВИЗУАЛЬНОЕ ВОСПРИЯТИЕ
САККАДИЧЕСКИЕ ДВИЖЕНИЯ ГЛАЗ
ПОИСК СКРЫТОЙ ЦЕЛИ
СТРАТЕГИИ
МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ
ОБЗОРЫ
БИБЛ. 66

Доп.точки доступа:
Chukoskie, Leanne; Snider, Joseph; Mozer, Michael C.; Krauzlis, Richard J.; Sejnowski, Terrence J.

РЖ ВИНИТИ 34 (BI24) 14.11-04М3.477

Dezfouli, A.
Habits, action sequences and reinforcement learning [Text] / A. Dezfouli, D. W. Balleine // Eur. J. Neurosci. - 2012. - Vol. 35, N 7. - P1036-1051 . - ISSN 0953-816X
Перевод заглавия: Привычки, последовательность действий и подкрепляемое научение (ПН)
Аннотация: Инструментальные действия могут быть целенаправленными (ЦИД) или продиктованными привычкой (ПИД); первые быстро приобретаются и регулируются результатом, вторые рефлекторны и обусловлены предшествующими стимулами, а не их результатами. Формирование ЦИД часто трактуют как основанное на модели ПН (МПН); эта схема мощна, но плохо объясняет развитие ПИД. Теоретически для формирования привычки необходим другой диспетчер действия, называемый безмодельным ПН (БПН), который формирует не модель мира, а скорее оценку действий в определенных состояниях, позволяя выбрать действие, основанное на истории его подкрепления, а не на результатах. У модели БПН есть прогностические проблемы; основная - неспособность предсказать нечувствительность ПИД к изменениям в обстоятельствах подкрепления действия. Предполагают, что применение схемы БПН в формировании инструментальных действий избыточно, и демонстрируют, что переосмысление привычки как последовательности действий позволяет применить МПН и к ЦИД, и к ПИД. Этот подход имеет существенное значение для методов исследования привычек и позволяет строить новые гипотезы. Австралия, Univ. of Sydney

ГРНТИ	34.39.23

ВИНИТИ 341.39.23.02
Рубрики: ДЕЙСТВИЯ
ИНСТРУМЕНТАЛЬНЫЕ
ЦЕЛЕНАПРАВЛЕННЫЕ
ПРИВЫЧНЫЕ
ФОРМИРОВАНИЕ
МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ

Доп.точки доступа:
Balleine, D.W.

"Электронные каталоги и базы данных библиотек СО РАН"

© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)

rtvarBDview(" результаты поиска","20190607010228","4682442");

Вид поиска