Глубокое обучение с подкреплением. Сравнение алгоритмов

Илья Павлович Мезенцев

Глубокое обучение с подкреплением. Сравнение алгоритмов

Мезенцев Илья Павлович

Аннотация

В данной работе представлены результаты изучения и реализации алгоритмов глубокого обучения с подкреплением. Кратко описаны основы обучения с подкреплением и глубоких нейронных сетей.
В качестве итога приводятся результаты экспериментов, и сравниваются две вариации алгоритма глубокого обучения с подкреплением (DQN), с помощью которых агенты обучались на различных средах. В качестве сред для исследования использовались игры Atari.

02.04.03 Математическое обеспечение и администрирование информационных систем

Глубокое обучение с подкреплением. Сравнение алгоритмов

Аннотация