Главная Назад


Авторизация
Идентификатор пользователя / читателя
Пароль (для удалённых пользователей)
 

Вид поиска

Область поиска
Найдено в других БД
Формат представления найденных документов:
библиографическое описаниекраткий полный
Отсортировать найденные документы по:
авторузаглавиюгоду изданиятипу документа
Поисковый запрос: (<.>S=МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ<.>)
Общее количество найденных документов : 3
Показаны документы с 1 по 3
1.

Вид документа : Статья из журнала
РЖ ВИНИТИ 15 (BI44) 13.02-04П1.26

Автор(ы) : Dezfouli A., Balleine D.W.
Заглавие : Habits, action sequences and reinforcement learning
Источник статьи : Eur. J. Neurosci. - 2012. - Vol. 35, N 7. - С. 1036-1051
Аннотация: Инструментальные действия могут быть целенаправленными (ЦИД) или продиктованными привычкой (ПИД); первые быстро приобретаются и регулируются результатом, вторые рефлекторны и обусловлены предшествующими стимулами, а не их результатами. Формирование ЦИД часто трактуют как основанное на модели ПН (МПН); эта схема мощна, но плохо объясняет развитие ПИД. Теоретически для формирования привычки необходим другой диспетчер действия, называемый безмодельным ПН (БПН), который формирует не модель мира, а скорее оценку действий в определенных состояниях, позволяя выбрать действие, основанное на истории его подкрепления, а не на результатах. У модели БПН есть прогностические проблемы; основная - неспособность предсказать нечувствительность ПИД к изменениям в обстоятельствах подкрепления действия. Предполагают, что применение схемы БПН в формировании инструментальных действий избыточно, и демонстрируют, что переосмысление привычки как последовательности действий позволяет применить МПН и к ЦИД, и к ПИД. Этот подход имеет существенное значение для методов исследования привычек и позволяет строить новые гипотезы. Австралия, Univ. of Sydney
ГРНТИ : 15.21.41
Предметные рубрики: ДЕЙСТВИЯ
ИНСТРУМЕНТАЛЬНЫЕ
ЦЕЛЕНАПРАВЛЕННЫЕ
ПРИВЫЧНЫЕ
ФОРМИРОВАНИЕ
МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ
Дата ввода:

2.

Вид документа : Статья из журнала
РЖ ВИНИТИ 15 (BI44) 14.02-04П1.47

Автор(ы) : Chukoskie, Leanne, Snider, Joseph, Mozer Michael C., Krauzlis Richard J., Sejnowski Terrence J.
Заглавие : Learning where to look for a hidden target
Источник статьи : Proc. Nat. Acad. Sci. USA. - 2013. - Vol. 110, прил. 2. - С. 10438-10445
Примечания : 66
Аннотация: Изучали направление саккадических движений глаз в задачах визуального поиска в зависимости от контекста и условий задачи. Разработана задача поиска нового местоположения невидимой цели, стохастически смещающейся в каждой пробе относительно первоначального положения, в парадигме подкрепляемого научения (ПН). Только в нескольких пробах участники быстро нашли скрытую цель, используя стратегию поиска в области, связанной с предыдущими удачными пробами, и избегания ранее "пустых" мест. Траектория обучения соответствует модели ПН, прогнозирующей чувствительность к недавнему опыту, подтвержденную эмпирически. Кривые научения испытуемых и прогноз согласно модели ПН приближаются к оптимальному функционированию, описываемому теорией идеального наблюдателя. Обсуждают вклад опыта в новой среде в организацию визуального поиска у людей и возможности распространить теорию на другие формы поиска (поиск пищи у животных). США, Univ. of California at San Diego,e-mail: terry@salk.edu
ГРНТИ : 15.21.41
Предметные рубрики: ПОИСКОВОЕ ПОВЕДЕНИЕ
ВИЗУАЛЬНОЕ ВОСПРИЯТИЕ
САККАДИЧЕСКИЕ ДВИЖЕНИЯ ГЛАЗ
ПОИСК СКРЫТОЙ ЦЕЛИ
СТРАТЕГИИ
МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ
ОБЗОРЫ
БИБЛ. 66
Дата ввода:

3.

Вид документа : Статья из журнала
РЖ ВИНИТИ 34 (BI24) 14.11-04М3.477

Автор(ы) : Dezfouli A., Balleine D.W.
Заглавие : Habits, action sequences and reinforcement learning
Источник статьи : Eur. J. Neurosci. - 2012. - Vol. 35, N 7. - С. 1036-1051
Аннотация: Инструментальные действия могут быть целенаправленными (ЦИД) или продиктованными привычкой (ПИД); первые быстро приобретаются и регулируются результатом, вторые рефлекторны и обусловлены предшествующими стимулами, а не их результатами. Формирование ЦИД часто трактуют как основанное на модели ПН (МПН); эта схема мощна, но плохо объясняет развитие ПИД. Теоретически для формирования привычки необходим другой диспетчер действия, называемый безмодельным ПН (БПН), который формирует не модель мира, а скорее оценку действий в определенных состояниях, позволяя выбрать действие, основанное на истории его подкрепления, а не на результатах. У модели БПН есть прогностические проблемы; основная - неспособность предсказать нечувствительность ПИД к изменениям в обстоятельствах подкрепления действия. Предполагают, что применение схемы БПН в формировании инструментальных действий избыточно, и демонстрируют, что переосмысление привычки как последовательности действий позволяет применить МПН и к ЦИД, и к ПИД. Этот подход имеет существенное значение для методов исследования привычек и позволяет строить новые гипотезы. Австралия, Univ. of Sydney
ГРНТИ : 34.39.23
Предметные рубрики: ДЕЙСТВИЯ
ИНСТРУМЕНТАЛЬНЫЕ
ЦЕЛЕНАПРАВЛЕННЫЕ
ПРИВЫЧНЫЕ
ФОРМИРОВАНИЕ
МОДЕЛЬ ПОДКРЕПЛЯЕМОГО НАУЧЕНИЯ
Дата ввода:

 




© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)