Главная Назад


Авторизация
Идентификатор пользователя / читателя
Пароль (для удалённых пользователей)
 

Вид поиска

Область поиска
Найдено в других БД
Формат представления найденных документов:
библиографическое описаниекраткийполный
Поисковый запрос: (<.>A=Jakkola, Tommi$<.>)
Общее количество найденных документов : 1
1.
РЖ ВИНИТИ 34 (BI38) 95.07-04А3.037

    Jakkola, Tommi.

    On the convergence of stochastic iterative dynamic programming algorithms [Text] / Tommi Jakkola, Michael F. Jordan // Neural Comput. - 1994. - Vol. 6, N 6. - P1185-1201 . - ISSN 0899-7667
Перевод заглавия: О сходимости стохастических итеративных алгоритмов динамического программирования
Аннотация: Проведено исследование различных алгоритмов обучения на основе усиления для предсказания и управления в марковской среде. Показано, что эти алгоритмы м. б. обоснованы эвристической аппроксимацией динамического программирования. На основе этого факта получены достаточно жесткие оценки скорости итеративных процедур обучения такого рода. Предложено точное формализованное описание класса алгоритмов с гарантированной сходимостью. Установлены связи с теорией Q-обучения. Представлены полные доказательства всех полученных теор. результатов. США, Dep. of Brain and Cognitive Sci., Massachusetts Inst. of Technology, Cambridge, MA 02139. Библ. 17.
ГРНТИ  
ВИНИТИ 341.55.21.19.09
Рубрики: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
ОБУЧЕНИЕ

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

СТОХАСТИЧЕСКИЕ ИТЕРАТИВНЫЕ АЛГОРИТМЫ

СХОДИМОСТЬ

МАРКОВСКАЯ СРЕДА


Доп.точки доступа:
Jordan, Michael F.

 




© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)