ПОИСК КЛЮЧЕВЫХ СУЩНОСТЕЙ НА БАЗЕ НЕЙРОННЫХ СЕТЕЙ

Жайгутов Ерлан Ермекович

Аннотация


Объект исследования – ключевые сущности в тексте.
Цель исследования – написание и обучение нейронной сети, которая будет находить ключевые сущности в тексте.
Результат: решена задача поиска ключевых сущностей на базе нейронных сетей в текстах на русском языке. Реализация написана на языке Python. Данные для обучения были взяты с Википедии.
Предложены и реализованы алгоритм извлечения статей из дампа Википедии для обучения НС, алгоритм для подготовки обучающих, валидационных и тестовых данных из статей, эвристический алгоритм для поиска ключевых сущностей в тексте, описание нейронной сети, обучение нейронной сети, модель нейронной сети, решающая задачу с желаемой точностью