Бинарная классификация новостных текстов на основе их тональности

Шемякин Дмитрий Геннадьевич

Аннотация


Объект исследования или разработки: бинарный классификатор, который классифицирует электронные новостные тексты в зависимости от их тональности.
Цель работы: разработка и реализация бинарного классификатора для анализа тональности новостных текстов.
Метод или методология проведения работы: создание и обработка набора данных электронных новостных текстов, инициализация и обучение классификаторов, а также последующее их применение осуществлялось в программной среде Spyder на языке Python.
Результаты работы: собран набор данных содержащий основные параметры электронных новостных текстов, были инициализированы и обучены две модели классификаторов тональностей текстов. Качество классификаторов было оценено на трёх различных наборах данных.
Область применения: модели классификаторов могут использоваться как различными компаниями, в частности их подразделениями аналитики, так и новостными сервисами, чтобы предлагать пользователям новости в зависимости от требуемой тональности.
Экономическая эффективность или значимость работы: в ходе работы на основе набора электронных новостных текстов была проведена комплексная оценка качества работы реализованных бинарных классификаторов. Дополнительно была проверена точность работы относительно различных категорий новостей.