Управление и анализ больших объемов данных в бизнес-архитектуре сложных систем

Лутфуллаева Малика Жасуровна

Аннотация


Актуальность темы обусловлена несовершенством существующих методов и подходов к сентимент-анализу Интернет-комментариев.
Целью работы является разработка и апробация нового подхода к сентимент-анализу в рамках решения задачи классификации Интернеткомментариев по эмоциональной окраске.
Задачи работы:
 рассмотреть теоретические особенности задачи сентимент-анализа Интернет-комментариев;
 изучить подходы и методы предварительной обработки и очискти текста, существующие подходы к векторизации, а также основные модели классификаторов;
 описать методику сентимент-анализа на основе тональной векторизации;
 обучить классификатор и провести его тестирование, интерпретировать полученные результаты.
Объектом исследования являются текстовые Интернет-комментарии как частный случай Больших Данных.
Предметом исследования является процесс выявления силы и характера эмоциональной тональности текста.
В первой главе рассматриваются теоретические аспекты управления и анализа больших объемов данных в бизнес-архитектуре сложных систем.
Вторая глава посвящена разработке методики проведения сентиментанализа на основе тонального векторизатора.
В третьей главе представлена реализация модели классификатора для определения эмоциональной окраски Интернет-комментариев клиентов банка.
Результаты работы: практическим результатом работы стал разработанный классификатор, который определяет эмоциональную оценку Интернет-комментария клиентов банка.