text matching названий компаний при ограниченных ресурсах на инференс модели
Аннотация
Яскевич М.С., text matching названий компаний при ограниченных ресурсах на инференс модели, выпускная квалификационная работа, 74 страницы, 1 рисунок, 9 таблиц, 18 использованных источников, 5 приложений.
Ключевые слова: TEXT MATCHING, ENTITY LINKAGE, FINE TUNING, TRANSFER LEARNING, ПРИВЯЗКА, НЕЙРОННЫЕ СЕТИ, КЛАССИФИКАЦИЯ.
В работе описывается применение подхода text matching для оценки схожести текстов и использовании этой оценки для задачи привязки. Проводится анализ возможных подходов text matching и named entity linkage. Выбирается оптимальная по качеству и производительности text matching модель. Изучаются системы привязки компаний к судебным делам и вакансиям. Описывается алгоритм построения выборки для text matching модели, процесс ее обучения, оценка качества и анализ полученных ошибок. Исследуется устойчивость text matching модели к смене домена на примере использования модели, обученной на домене судебных дел, в задаче привязки компаний к вакансиям. Предоставляется код для основных экспериментов.
Ключевые слова: TEXT MATCHING, ENTITY LINKAGE, FINE TUNING, TRANSFER LEARNING, ПРИВЯЗКА, НЕЙРОННЫЕ СЕТИ, КЛАССИФИКАЦИЯ.
В работе описывается применение подхода text matching для оценки схожести текстов и использовании этой оценки для задачи привязки. Проводится анализ возможных подходов text matching и named entity linkage. Выбирается оптимальная по качеству и производительности text matching модель. Изучаются системы привязки компаний к судебным делам и вакансиям. Описывается алгоритм построения выборки для text matching модели, процесс ее обучения, оценка качества и анализ полученных ошибок. Исследуется устойчивость text matching модели к смене домена на примере использования модели, обученной на домене судебных дел, в задаче привязки компаний к вакансиям. Предоставляется код для основных экспериментов.