Развитие системы интент-анализа текста
Аннотация
Реферат
Пояснительная записка 119 страниц, 26 рисунка, 28 таблиц, 26 источников, 3 приложения.
Актуальность работы: в связи с активизацией политических провокаторов в значительной части мира, включая Россию, представляется актуальным анализ публицистических текстов с целью выявления реальных, но скрываемых (за завесой громких уверений в политкорректности) замыслов, иначе говоря, интент-анализ.
Цель исследования – развить и модифицировать интент-анализатор текста.
Для достижения поставленной цели нужно решить следующие задачи:
- проанализировать существующие в настоящее системы интент-анализа текстов;
- произвести отбор аналогов;
- разработать пакет моделей;
- разработать проект интент-анализатора;
- провести опыты на разработанной системе интент анализа-текстов.
Объект исследования – интент-анализ текстов.
Предмет исследования – система интент-анализа текстов.
Научная новизна работы:
- использование дуплексных семантических структур и порождаемых ими сегментов для кластер-сегментации, что, в свою очередь требует модификации блока кластер-сегментации (как прототипа 1 ранга), добавление в него блока машинного понимания текста с функцией обнаружения семантических структур;
- использование не классификационных, а фоносемантических характеристик для оценивания кластер-сегментов в статике и динамике, что также требует модификации некоторых структурных составляющих. Использование новых моментов позволяет заметно расширить возможности анализатора с выходом за границы собственно интент-анализа.
Пояснительная записка 119 страниц, 26 рисунка, 28 таблиц, 26 источников, 3 приложения.
Актуальность работы: в связи с активизацией политических провокаторов в значительной части мира, включая Россию, представляется актуальным анализ публицистических текстов с целью выявления реальных, но скрываемых (за завесой громких уверений в политкорректности) замыслов, иначе говоря, интент-анализ.
Цель исследования – развить и модифицировать интент-анализатор текста.
Для достижения поставленной цели нужно решить следующие задачи:
- проанализировать существующие в настоящее системы интент-анализа текстов;
- произвести отбор аналогов;
- разработать пакет моделей;
- разработать проект интент-анализатора;
- провести опыты на разработанной системе интент анализа-текстов.
Объект исследования – интент-анализ текстов.
Предмет исследования – система интент-анализа текстов.
Научная новизна работы:
- использование дуплексных семантических структур и порождаемых ими сегментов для кластер-сегментации, что, в свою очередь требует модификации блока кластер-сегментации (как прототипа 1 ранга), добавление в него блока машинного понимания текста с функцией обнаружения семантических структур;
- использование не классификационных, а фоносемантических характеристик для оценивания кластер-сегментов в статике и динамике, что также требует модификации некоторых структурных составляющих. Использование новых моментов позволяет заметно расширить возможности анализатора с выходом за границы собственно интент-анализа.