Задача планирования для марковских игр среднего поля

Волков Алексей Михайлович

Аннотация


Задача планирования для игры среднего поля исследует возможность перевести распределение бесконечного числа рациональных однотипных игроков в желаемое состояние за счет выбора терминального выигрыша. Рассматривается случай, когда динамика пробного игрока задается марковской цепью с конечным числом состояний. Построен пример задачи планирования, которая не имеет решения. Предложен вариант регуляризации марковских задач планирования в виде решения наименьшего сожаления, основанный на регуляризации эквивалентной задачи оптимального управления. Доказана теорема о том, что множество решений наименьшего сожаления непусто, замкнуто, а также совпадает с замыканием множества классических решений, в случае непустоты последнего.