ДЕТЕКЦИЯ КЛОНОВ В ИСХОДНОМ КОДЕ
Аннотация
Отчет 50 с., 13 рис., 4 табл., 22 источн., 3 прил.
Ключевые слова: машинное обучение, аугментация, POJ-104, стати-стическая значимость, Clone Detection
Цель работы - на основе существующих подходов к аугментирова-нию данных разработать способ улучшения информационной ценности набора данных для решения задачи Clone Detection, использующий струк-туры данных, отображающие семантическое устройство сниппета.
Методы проведения работы: исследование результатов обучения мо-дели GraphCodeBert на основе разнообразных аугментаций датасета POJ-104, анализ метрик результатов, проверка их статистической значимости.
Результат работы: выбор метода представления дополнительных структурных данных, который повышает результаты обучения модели, расширяя информацию о сниппете кода.
Область применения полученных результатов: модификация датасе-тов для задачи Clone Detection.
Ключевые слова: машинное обучение, аугментация, POJ-104, стати-стическая значимость, Clone Detection
Цель работы - на основе существующих подходов к аугментирова-нию данных разработать способ улучшения информационной ценности набора данных для решения задачи Clone Detection, использующий струк-туры данных, отображающие семантическое устройство сниппета.
Методы проведения работы: исследование результатов обучения мо-дели GraphCodeBert на основе разнообразных аугментаций датасета POJ-104, анализ метрик результатов, проверка их статистической значимости.
Результат работы: выбор метода представления дополнительных структурных данных, который повышает результаты обучения модели, расширяя информацию о сниппете кода.
Область применения полученных результатов: модификация датасе-тов для задачи Clone Detection.