Развитие системы интент-анализа текста

Потапов Никита Андреевич

Аннотация


Реферат

Пояснительная записка 119 страниц, 26 рисунка, 28 таблиц, 26 источников, 3 приложения.

Актуальность работы: в связи с активизацией политических провокаторов в значительной части мира, включая Россию, представляется актуальным анализ публицистических текстов с целью выявления реальных, но скрываемых (за завесой громких уверений в политкорректности) замыслов, иначе говоря, интент-анализ.

Цель исследования – развить и модифицировать интент-анализатор текста.

Для достижения поставленной цели нужно решить следующие задачи:

- проанализировать существующие в настоящее системы интент-анализа текстов;

- произвести отбор аналогов;

- разработать пакет моделей;

- разработать проект интент-анализатора;

- провести опыты на разработанной системе интент анализа-текстов.

Объект исследования – интент-анализ текстов.

Предмет исследования – система интент-анализа текстов.

Научная новизна работы:

- использование дуплексных семантических структур и порождаемых ими сегментов для кластер-сегментации, что, в свою очередь требует модификации блока кластер-сегментации (как прототипа 1 ранга), добавление в него блока машинного понимания текста с функцией обнаружения семантических структур;

- использование не классификационных, а фоносемантических характеристик для оценивания кластер-сегментов в статике и динамике, что также требует модификации некоторых структурных составляющих. Использование новых моментов позволяет заметно расширить возможности анализатора с выходом за границы собственно интент-анализа.