Применение системы LLM-агентов для решения задач, требующих рассуждений.

Хренников Артем Игоревич

Аннотация


Целью ВКР являлось создание нескольких вариантов систем агентов на основе LLM, анализ и сравнение их результатов в задачах, требующих рассуждений. За счет временных ограничений, исследования пришлось ограничить в рамках одного набора данных, а именно GSM8K. Решение каждой задачи в нем являются единственным числом, что легко оценивать. Одной из основных задач было создание системы агентов на основе больших языковых моделей с небольшим по их меркам количеством параметров. Для выбора кандидата в агенты рассматривались большие языковые модели с кодом в открытом доступе размером начиная от 7 миллиардов параметров. В результате проделанных наблюдений было решено использовать llama3 8b. Чтобы агент лучше понимал своё место в мультиагентной системе, а также для улучшения взаимодействия между агентами, агентам назначались следующие роли: агент-ученик, агент-учитель, агент, меняющий формулировку текста (сохраняя при этом смысл), агент, проверяющий итоговый ответ, а также агент, меняющий уровень абстракции задачи. В результате ВКР было создано двенадцать различных систем агентов в двух версиях: с применением цепей мыслей и без. Большая часть систем не показала себя лучше одной большой языковой модели, однако две из них всё же смогли отличиться: система из двух агентов-учеников с разными подходами к решению и агента учителя, а также система, состоящая из двух агентов, меняющих уровень абстракции задачи, и агента ученика.