Разработка автоматизированной системы комплексного структурно-семантического и тематического анализа естественно языковых текстов

Петрова Алена Игоревна

Аннотация


Актуальность темы обусловлена потребностью предприятий во внедрении, в качестве основы всех предоставляемых продуктов и услуг, автоматизированной системы комплексного структурно - семантического и тематического анализа естественно языковых текстов (русскоязычного лингвистического анализатора).
Целью работы является разработка автоматизированной системы комплексного структурно - семантического и тематического анализа естественно языковых текстов, а именно эффективного русскоязычного лингвистического анализатора, способного безошибочно определять части речи слов и их морфологические характеристики, так как на момент создания компании Relation Rate таковые отсутствовали на рынке
Задачи данной ВКР:
изучить теоретические основы русскоязычных частей речи, а также их
морфологические характеристик,
выявить русскоязычные анализаторы, представленные на рынке,
проанализировать их достоинства и недостатки,
определить средства разработки, способные обойти проблемы,
присутствующие в ранее разработанных лингвистических анализаторах,
построить полную модель предприятия OOO Relation Rate, тем самым
проанализировать ее деятельность,
описать бизнес – процесс рассматриваемой мной компании после внедрения
анализатора,
с помощью выбранной методологии описать план разработки проекта,
исходя из выявленных средств разработки создать новый эффективный лингвистический анализатор,
провести экономический анализ внедряемого проекта, а также написать его экономическое обоснование.
Объектом исследования данной выпускной квалификационной работы является инструментарий анализа естественно языковых текстов. Предметом исследования является - автоматизация процесса анализа естественно языковых текстов OOO Relation Rate.
В первом разделе выпускной квалификационной работы подробно рассмотрены все существующие части речи русского языка, а также их морфологические характеристики. Выявлены и проанализированы популярные инструментарии для определения частей речи слов русского языка. Также в первом разделе данной работы выявлены и подробно описаны средства необходимые для разработки нового эффективного лингвистического анализатора.
Во втором разделе данной выпускной квалификационной работы проведен тщательный анализ ООО Relation Rate, а также построена полная модель данного предприятия. Создана модель TO-BE, наглядно демонстрирующая внедрение новой системы в рассматриваемую мной организацию. Также во втором разделе выпускной квалификационной работы разработан план внедрения разрабатываемого проекта, исходя из выбранной методологии, а также описана и проанализирована экономическая сторона разрабатываемой системы.
Результаты работы – практическим результатом работы стала разработанная автоматизированная система комплексного структурно - семантического и тематического анализа естественно языковых текстов (русскоязычный лингвистического анализатора).