Разработка нейросетевого алгоритма для поиска оптимальных стратегий в квантовой игре Гекс

Бикмурзин Михаил Алексеевич

Аннотация


Целью исследования являлась разработка нейросетевого алгоритма с целью поиска оптимальных стратегий в квантовой игре Гекс.
Для достижения поставленной цели были решены следующие задачи:
• Изучение технологии нейронных сетей;
• Исследование алгоритма обучения с подкреплением, реализованного для программы AlphaGo Zero от подразделения компании Google DeepMind;
• Программная реализация нейросетевого алгоритма для поиска оптимальных стратегий в классической версии Гекс;
• Модернизация реализованного алгоритма для квантовой версии Гекс;
• Запуск программы обучения и накопление результатов на суперкомпьютере «‎Уран»;
Дипломная работа состоит из введения, трех глав и списка использованных источников.
Во введении кратко рассказывается о применении игр в различных областях науки и техники, а также их влиянии на отрасль искусственного интеллекта. Формулируются цели и задачи, решение которых необходимо для выполнения работы.
В первой главе предоставляются теоретические материалы, необходимые для понимания проделанной работы. Описываются принципы работы нейронных сетей, правила игры и основные понятия в классическом Гекс. Также приводятся алгоритм обучения нейронной сети AlphaGo Zero и необходимый для его реализации поиск по дереву методом Монте-Карло.
Вторая глава посвящена литературному обзору данной работы. В ней приводятся история применения программных методов для различных интеллектуальных игр, методы исследования классической версии Гекс, а также описывается квантовая игра Го, послужившая прообразом квантового Гекс.
В третьей главе вводятся правила квантовой игры Гекс, описываются принципиальные ее отличия от классической версии и демонстрируется возможность проведения хода партии на квантовом устройстве. Приводятся результаты обучения агента классическому Гекс для размерности игрового поля 7х7 при помощи модернизированного для двух нейронных сетей алгоритма обучения AlphaGo Zero. Также предоставляются результаты обучения агентов квантовому Гекс для размерностей досок 3х3 и 4х4.
В заключении подытоживаются основные результаты, достигнутые в рамках проделанной работы.