КЛАССИФИКАЦИЯ НОВОСТНЫХ СТАТЕЙ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ

Часовитин Александр Андреевич

Аннотация


Часовитин АА. КЛАССИФИКАЦИЯ НОВОСТНЫХ СТАТЕЙ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ, магистерская диссертация: стр. 41, табл. 6, рис. 15, библ. 17 назв.
Ключевые слова: МАШИННОЕ ОБУЧЕНИЕ, АЛГОРИТМ ОБУЧЕНИЯ,
НОВОСТНАЯ СТАТЬЯ, ТЕКСТОВЫЙ ДОКУМЕНТ, КЛАССИФИКАЦИЯ
ДОКУМЕНТОВ, ОБРАБОТКА ДАННЫХ, PYTHON, SCIKIT-LEARN.
Объект исследования — математическая модель машинного обучения.
Цель работы — создать и обучить классификатор новостных статей,
разделённых на категории. Каждая новостная статья относится только к одной категории.
В процессе работы проводились экспериментальные исследования
отдельных составляющих, то есть параметров моделей машинного обучения, и аппаратной системы в целом.
В результате работы удалось создать автоматический классификатор и обучить его таким образом, что он мог с достаточной достоверностью классифицировать новостные статьи по их тексту.
Внедрение классификатора новостных статей уменьшит вклад ручного труда на рубрикацию и поиск интересующей информации из информационных источников. К тому же подобная система позволит уменьшить ручную работу специалистов, связанную с сохранением информации или её обработкой для производственных или иных нужд.
Полученные результаты могут быть использована для построения
аналогичных классификаторов документов из различных баз знаний.