АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТОВ СМИ НА ОСНОВЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
Аннотация
Плисковский Михаил Юрьевич. АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТОВ
СМИ НА ОСНОВЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ, квалификационная работа на степень бакалавра наук: стр. 28, рис. 3, табл. 3, приложений
1, CD-диск с текстом работы и программой.
Ключевые слова: обработка естественного языка, машинное обучение, метод опорных векторов, наивный байесовский классификатор
Данная работа посвящена исследованию применения методов машинного обучения для определения эмоциональной составляющей (тональности) текстов СМИ на русском языке. Рассматриваются способы построения векторной модели текста с применением разбиения на n-граммы слов, а также использованием меры TF-IDF. Подробно рассмотрены 2 метода: наивный байесовский классификатор и метод опорных векторов. Эксперимент показал, что с поставленной задачей лучше справляется метод опорных векторов. Точность на
обучающей выборке составила 73.5%.
Для проведения эксперимента использовалась библиотека scikit-learn для языка программирования Python 3.
СМИ НА ОСНОВЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ, квалификационная работа на степень бакалавра наук: стр. 28, рис. 3, табл. 3, приложений
1, CD-диск с текстом работы и программой.
Ключевые слова: обработка естественного языка, машинное обучение, метод опорных векторов, наивный байесовский классификатор
Данная работа посвящена исследованию применения методов машинного обучения для определения эмоциональной составляющей (тональности) текстов СМИ на русском языке. Рассматриваются способы построения векторной модели текста с применением разбиения на n-граммы слов, а также использованием меры TF-IDF. Подробно рассмотрены 2 метода: наивный байесовский классификатор и метод опорных векторов. Эксперимент показал, что с поставленной задачей лучше справляется метод опорных векторов. Точность на
обучающей выборке составила 73.5%.
Для проведения эксперимента использовалась библиотека scikit-learn для языка программирования Python 3.