СибНСХБ

Вид поиска

Область поиска

Найдено в других БД

Формат представления найденных документов:
библиографическое описание	краткий	полный

Поисковый запрос: (<.>A=Jakkola, Tommi$<.>)

Общее количество найденных документов : 1

РЖ ВИНИТИ 34 (BI38) 95.07-04А3.037

Jakkola, Tommi.
On the convergence of stochastic iterative dynamic programming algorithms [Text] / Tommi Jakkola, Michael F. Jordan // Neural Comput. - 1994. - Vol. 6, N 6. - P1185-1201 . - ISSN 0899-7667
Перевод заглавия: О сходимости стохастических итеративных алгоритмов динамического программирования
Аннотация: Проведено исследование различных алгоритмов обучения на основе усиления для предсказания и управления в марковской среде. Показано, что эти алгоритмы м. б. обоснованы эвристической аппроксимацией динамического программирования. На основе этого факта получены достаточно жесткие оценки скорости итеративных процедур обучения такого рода. Предложено точное формализованное описание класса алгоритмов с гарантированной сходимостью. Установлены связи с теорией Q-обучения. Представлены полные доказательства всех полученных теор. результатов. США, Dep. of Brain and Cognitive Sci., Massachusetts Inst. of Technology, Cambridge, MA 02139. Библ. 17.

ГРНТИ	34.55.21

ВИНИТИ 341.55.21.19.09
Рубрики: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
ОБУЧЕНИЕ
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
СТОХАСТИЧЕСКИЕ ИТЕРАТИВНЫЕ АЛГОРИТМЫ
СХОДИМОСТЬ
МАРКОВСКАЯ СРЕДА

Доп.точки доступа:
Jordan, Michael F.

"Электронные каталоги и базы данных библиотек СО РАН"

© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)

rtvarBDview(" результаты поиска","20190607010228","4682442");

Вид поиска