Главная Назад


Авторизация
Идентификатор пользователя / читателя
Пароль (для удалённых пользователей)
 

Вид поиска

Область поиска
Найдено в других БД
Формат представления найденных документов:
библиографическое описаниекраткийполный
Отсортировать найденные документы по:
авторузаглавиюгоду изданиятипу документа
Поисковый запрос: (<.>S=МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ<.>)
Общее количество найденных документов : 3
Показаны документы с 1 по 3
1.
РЖ ВИНИТИ 15 (BI44) 13.02-04П1.26

    Dezfouli, A.

    Habits, action sequences and reinforcement learning [Text] / A. Dezfouli, D. W. Balleine // Eur. J. Neurosci. - 2012. - Vol. 35, N 7. - P1036-1051 . - ISSN 0953-816X
Перевод заглавия: Привычки, последовательность действий и подкрепляемое научение (ПН)
Аннотация: Инструментальные действия могут быть целенаправленными (ЦИД) или продиктованными привычкой (ПИД); первые быстро приобретаются и регулируются результатом, вторые рефлекторны и обусловлены предшествующими стимулами, а не их результатами. Формирование ЦИД часто трактуют как основанное на модели ПН (МПН); эта схема мощна, но плохо объясняет развитие ПИД. Теоретически для формирования привычки необходим другой диспетчер действия, называемый безмодельным ПН (БПН), который формирует не модель мира, а скорее оценку действий в определенных состояниях, позволяя выбрать действие, основанное на истории его подкрепления, а не на результатах. У модели БПН есть прогностические проблемы; основная - неспособность предсказать нечувствительность ПИД к изменениям в обстоятельствах подкрепления действия. Предполагают, что применение схемы БПН в формировании инструментальных действий избыточно, и демонстрируют, что переосмысление привычки как последовательности действий позволяет применить МПН и к ЦИД, и к ПИД. Этот подход имеет существенное значение для методов исследования привычек и позволяет строить новые гипотезы. Австралия, Univ. of Sydney
ГРНТИ  
ВИНИТИ 151.21.41.31
Рубрики: ДЕЙСТВИЯ
ИНСТРУМЕНТАЛЬНЫЕ

ЦЕЛЕНАПРАВЛЕННЫЕ

ПРИВЫЧНЫЕ

ФОРМИРОВАНИЕ

МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ


Доп.точки доступа:
Balleine, D.W.


2.
РЖ ВИНИТИ 15 (BI44) 14.02-04П1.47

   

    Learning where to look for a hidden target [Text] / Leanne Chukoskie [et al.] // Proc. Nat. Acad. Sci. USA. - 2013. - Vol. 110, прил. 2. - P10438-10445. - 66 . - ISSN 0027-8424
Перевод заглавия: Научение в поиске скрытой цели
Аннотация: Изучали направление саккадических движений глаз в задачах визуального поиска в зависимости от контекста и условий задачи. Разработана задача поиска нового местоположения невидимой цели, стохастически смещающейся в каждой пробе относительно первоначального положения, в парадигме подкрепляемого научения (ПН). Только в нескольких пробах участники быстро нашли скрытую цель, используя стратегию поиска в области, связанной с предыдущими удачными пробами, и избегания ранее "пустых" мест. Траектория обучения соответствует модели ПН, прогнозирующей чувствительность к недавнему опыту, подтвержденную эмпирически. Кривые научения испытуемых и прогноз согласно модели ПН приближаются к оптимальному функционированию, описываемому теорией идеального наблюдателя. Обсуждают вклад опыта в новой среде в организацию визуального поиска у людей и возможности распространить теорию на другие формы поиска (поиск пищи у животных). США, Univ. of California at San Diego,e-mail: terry@salk.edu
ГРНТИ  
ВИНИТИ 151.21.41.31
Рубрики: ПОИСКОВОЕ ПОВЕДЕНИЕ
ВИЗУАЛЬНОЕ ВОСПРИЯТИЕ

САККАДИЧЕСКИЕ ДВИЖЕНИЯ ГЛАЗ

ПОИСК СКРЫТОЙ ЦЕЛИ

СТРАТЕГИИ

МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ

ОБЗОРЫ

БИБЛ. 66


Доп.точки доступа:
Chukoskie, Leanne; Snider, Joseph; Mozer, Michael C.; Krauzlis, Richard J.; Sejnowski, Terrence J.


3.
РЖ ВИНИТИ 34 (BI24) 14.11-04М3.477

    Dezfouli, A.

    Habits, action sequences and reinforcement learning [Text] / A. Dezfouli, D. W. Balleine // Eur. J. Neurosci. - 2012. - Vol. 35, N 7. - P1036-1051 . - ISSN 0953-816X
Перевод заглавия: Привычки, последовательность действий и подкрепляемое научение (ПН)
Аннотация: Инструментальные действия могут быть целенаправленными (ЦИД) или продиктованными привычкой (ПИД); первые быстро приобретаются и регулируются результатом, вторые рефлекторны и обусловлены предшествующими стимулами, а не их результатами. Формирование ЦИД часто трактуют как основанное на модели ПН (МПН); эта схема мощна, но плохо объясняет развитие ПИД. Теоретически для формирования привычки необходим другой диспетчер действия, называемый безмодельным ПН (БПН), который формирует не модель мира, а скорее оценку действий в определенных состояниях, позволяя выбрать действие, основанное на истории его подкрепления, а не на результатах. У модели БПН есть прогностические проблемы; основная - неспособность предсказать нечувствительность ПИД к изменениям в обстоятельствах подкрепления действия. Предполагают, что применение схемы БПН в формировании инструментальных действий избыточно, и демонстрируют, что переосмысление привычки как последовательности действий позволяет применить МПН и к ЦИД, и к ПИД. Этот подход имеет существенное значение для методов исследования привычек и позволяет строить новые гипотезы. Австралия, Univ. of Sydney
ГРНТИ  
ВИНИТИ 341.39.23.02
Рубрики: ДЕЙСТВИЯ
ИНСТРУМЕНТАЛЬНЫЕ

ЦЕЛЕНАПРАВЛЕННЫЕ

ПРИВЫЧНЫЕ

ФОРМИРОВАНИЕ

МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ


Доп.точки доступа:
Balleine, D.W.


 




© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)