Алгоритмы обучения с подкреплением и рекуррентные нейронные сети в приложении к задачам управления
Аннотация
Дипломная работа на тему «Алгоритмы обучения с подкреплением и рекуррентные нейронные сети в приложении к задачам управления» написана 26 страницах компьютерного текста, содержит 11 рисунков. Список использованных источников включает 6 наименований.
Работа проводилась студентом Миргородским Н. В. под руководством Плаксина А. Р. При проведении работ был использован суперкомпьютер «Уран» ИММ УрО РАН.
Цель работы – исследование подходов к реализации метода обучения Q-learning для агентов на основе рекуррентной нейронной сети и их сравнение на примере задач управления.
В работе использовались следующие методы исследования: аналитический, экспериментальный.
Вывод: агенты, основанные на рекуррентных нейронных сетях, показали большую стабильность и результативность в сложных задачах управления чем не рекуррентные агенты.
Новизна заключается в оценке применимости рекуррентных нейронных сетей вместо не рекуррентных для повышения производительности.
Ключевые слова: обучение с подкреплением, Q-Learning, рекуррентные нейронные сети, глубокие нейронные сети, LSTM, эффективность, за-дачи управления.
Работа проводилась студентом Миргородским Н. В. под руководством Плаксина А. Р. При проведении работ был использован суперкомпьютер «Уран» ИММ УрО РАН.
Цель работы – исследование подходов к реализации метода обучения Q-learning для агентов на основе рекуррентной нейронной сети и их сравнение на примере задач управления.
В работе использовались следующие методы исследования: аналитический, экспериментальный.
Вывод: агенты, основанные на рекуррентных нейронных сетях, показали большую стабильность и результативность в сложных задачах управления чем не рекуррентные агенты.
Новизна заключается в оценке применимости рекуррентных нейронных сетей вместо не рекуррентных для повышения производительности.
Ключевые слова: обучение с подкреплением, Q-Learning, рекуррентные нейронные сети, глубокие нейронные сети, LSTM, эффективность, за-дачи управления.