Разработка и обучение с подкреплением агента на примере игры Clash Royale
Аннотация
Выпускная квалификационная работа посвящена разработке игрового агента для игры Clash Royale, способного выигрывать у реальных людей, принимая решения на основе неполной визуальной информации.
Цель работы – создание игрового агента, способного принимать решение на основе неполной информации состояния игры в реальном времени и проверка сформулированной гипотезы.
Объект исследования – игра Clash Royale и её особенности.
Предмет исследования – процесс разработки, обучения и тестирования агента для данной игры.
Методы исследования: обнаружение объектов, классификация
картинок, кодирование данных и состояния игры, алгоритмы обучения с подкреплением, оценка производительности агента, анализ результатов.
Первый раздел посвящен обзору литературы и описанию игры с её особенностями.
Второй раздел посвящен процессу получения данных для обучения агента, путём считывание визуальной информации с помощью компьютерного зрения и кодирования её.
Третий раздел посвящен описанию теоретического фундамента обучения с подкреплением
Четвертый раздел посвящен описанию этапов в решении задачи с помощью обучения с подкреплением, таких как формирование среды и выбор алгоритмов.
Пятый раздел посвящен реализации среды и агента, а также результаты обучения агента
Результатом работы: создан агент, который способен принимать
оптимальные решения и выигрывать у реальных игроков, а также применение методов в игре Clash Royale может привести к предложениям по их использованию в других областях (финансы, робототехника и т. д.), где необходимо принятие оптимальных решений с аналогичными особенностями среды на основе обучения с подкреплением.
Цель работы – создание игрового агента, способного принимать решение на основе неполной информации состояния игры в реальном времени и проверка сформулированной гипотезы.
Объект исследования – игра Clash Royale и её особенности.
Предмет исследования – процесс разработки, обучения и тестирования агента для данной игры.
Методы исследования: обнаружение объектов, классификация
картинок, кодирование данных и состояния игры, алгоритмы обучения с подкреплением, оценка производительности агента, анализ результатов.
Первый раздел посвящен обзору литературы и описанию игры с её особенностями.
Второй раздел посвящен процессу получения данных для обучения агента, путём считывание визуальной информации с помощью компьютерного зрения и кодирования её.
Третий раздел посвящен описанию теоретического фундамента обучения с подкреплением
Четвертый раздел посвящен описанию этапов в решении задачи с помощью обучения с подкреплением, таких как формирование среды и выбор алгоритмов.
Пятый раздел посвящен реализации среды и агента, а также результаты обучения агента
Результатом работы: создан агент, который способен принимать
оптимальные решения и выигрывать у реальных игроков, а также применение методов в игре Clash Royale может привести к предложениям по их использованию в других областях (финансы, робототехника и т. д.), где необходимо принятие оптимальных решений с аналогичными особенностями среды на основе обучения с подкреплением.