text matching названий компаний при ограниченных ресурсах на инференс модели

Яскевич Михаил Сергеевич

Аннотация


Яскевич М.С., text matching названий компаний при ограниченных ресурсах на инференс модели, выпускная квалификационная работа, 74 страницы, 1 рисунок, 9 таблиц, 18 использованных источников, 5 приложений.
Ключевые слова: TEXT MATCHING, ENTITY LINKAGE, FINE TUNING, TRANSFER LEARNING, ПРИВЯЗКА, НЕЙРОННЫЕ СЕТИ, КЛАССИФИКАЦИЯ.
В работе описывается применение подхода text matching для оценки схожести текстов и использовании этой оценки для задачи привязки. Проводится анализ возможных подходов text matching и named entity linkage. Выбирается оптимальная по качеству и производительности text matching модель. Изучаются системы привязки компаний к судебным делам и вакансиям. Описывается алгоритм построения выборки для text matching модели, процесс ее обучения, оценка качества и анализ полученных ошибок. Исследуется устойчивость text matching модели к смене домена на примере использования модели, обученной на домене судебных дел, в задаче привязки компаний к вакансиям. Предоставляется код для основных экспериментов.