Главная Назад


Авторизация
Идентификатор пользователя / читателя
Пароль (для удалённых пользователей)
 

Вид поиска

Область поиска
Найдено в других БД
Формат представления найденных документов:
библиографическое описаниекраткий полный
Поисковый запрос: (<.>S=МАРКОВСКАЯ СРЕДА<.>)
Общее количество найденных документов : 1
1.

Вид документа : Статья из журнала
РЖ ВИНИТИ 34 (BI38) 95.07-04А3.037

Автор(ы) : Jakkola, Tommi, Jordan Michael F.
Заглавие : On the convergence of stochastic iterative dynamic programming algorithms
Источник статьи : Neural Comput. - 1994. - Vol. 6, N 6. - С. 1185-1201
Аннотация: Проведено исследование различных алгоритмов обучения на основе усиления для предсказания и управления в марковской среде. Показано, что эти алгоритмы м. б. обоснованы эвристической аппроксимацией динамического программирования. На основе этого факта получены достаточно жесткие оценки скорости итеративных процедур обучения такого рода. Предложено точное формализованное описание класса алгоритмов с гарантированной сходимостью. Установлены связи с теорией Q-обучения. Представлены полные доказательства всех полученных теор. результатов. США, Dep. of Brain and Cognitive Sci., Massachusetts Inst. of Technology, Cambridge, MA 02139. Библ. 17.
ГРНТИ : 34.55.21
Предметные рубрики: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
ОБУЧЕНИЕ
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
СТОХАСТИЧЕСКИЕ ИТЕРАТИВНЫЕ АЛГОРИТМЫ
СХОДИМОСТЬ
МАРКОВСКАЯ СРЕДА
Дата ввода:

 




© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)