Автоматическая классификация пользовательских заявок в сфере ЖКХ

Савельев Матвей Олегович

Аннотация


44 с., 23 рис., 1 табл., 7 источников, 0 прил.
НЕЙРОННЫЕ СЕТИ, КЛАССИФИКАЦИЯ ТЕКСТА, GRU, LSTM, ОБРАБОТКА ТЕКСТА, ВЕКТОРНОЕ ПРЕДСТАВЛЕНИЕ СЛОВ

Объектом разработки является классификатор пользовательских заявок в сфере жилищно-коммунального хозяйства.

Цель работы – создание классификатора пользовательских заявок в сфере ЖКХ с использованием нейронных сетей.

Задачи работы:
1) Изучить устройство современных нейронных сетей.
2) Проанализировать исходные данные и подготовить датасет для обучения нейронных сетей.
3) Построить и обучить несколько нейронных сетей для классификации заявок с помощью python-библиотеки keras, сравнить их по размеру, точности и времени обучения.
4) Рассмотреть возможные методы улучшения работы классификатора и применить их на практике.

Актуальность работы обусловлена спросом на сокращение стоимости обработки одной заявки, вызванного увеличением количества заявок в связи с цифровизацией сферы ЖКХ.
В работе рассмотрены следующие компоненты нейронных сетей: полносвязный слой, базовый рекуррентный слой, LSTM, GRU, слой векторных представлений слов. Приведен пример нейронной сети, построенной из данных слоев. Разработана методика очистки данных для обучения. В качестве метода улучшения работы сети было применено трансферное обучение для векторного представления слов, а также дополнительная фильтрация исходных данных и аугментация минорных классов с помощью генерации перестановок слов.

Результатом работы является обученная модель нейронной сети, точность которой составляет 86,9 %. Данная нейронная сеть будет использоваться компанией DOMA.AI для автоматической классификации заявок своих клиентов.