Глубокое обучение с подкреплением. Сравнение алгоритмов

Мезенцев Илья Павлович

Аннотация


В данной работе представлены результаты изучения и реализации алгоритмов глубокого обучения с подкреплением. Кратко описаны основы обучения с подкреплением и глубоких нейронных сетей.
В качестве итога приводятся результаты экспериментов, и сравниваются две вариации алгоритма глубокого обучения с подкреплением (DQN), с помощью которых агенты обучались на различных средах. В качестве сред для исследования использовались игры Atari.