Решение задач динамической оптимизации алгоритмом Advantage Actor Critic

Чайков Александр Игоревич

Аннотация


Чайков А. И. РЕШЕНИЕ ЗАДАЧ ДИНАМИЧЕСКОЙ ОПТИМИЗАЦИИ АЛГОРИТМОМ ADVANTAGE ACTOR CRITIC, выпускная квалификационная работа бакалавра: страниц 39, библиографических названий 3, рисунков 11, приложение 1 на 16 страницах.
Ключевые слова: ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ, ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ, РЕАЛИЗАЦИЯ АЛГОРИТМА, ДИНАМИЧЕСКАЯ ОПТИМИЗАЦИЯ, PYTHON 3.
Объектом исследования являются некоторые задачи динамической оптимизации, которые сводятся к задачам обучения с подкреплением и решаются алгоритмами Advantage Actor Critic и Asynchronous Advantage Actor Critic. Целью работы является реализация соответствующих алгоритмов на языке python версии 3 и проведение тестов на суперкомпьютере. Результаты работы могут применяться для решения задач динамической оптимизации и обучения с подкреплением.