Глагольная тропонимия в структуре тезаурусов и практике речевой коммуникации
Аннотация
Работа посвящена изучению принципов идеографического описания лексики, семантических связей между лексическими единицами, в частности, глагольной гипонимии, или тропонимии. Отдельное внимание уделяется методам автоматического и автоматизированного установления глагольных гипо-гиперонимических пар. Материалом исследования являются сто гипо-гиперонимических глагольных пар русского языка, а также словарные статьи из «Словаря синонимов русского языка» под редакцией Л. Г. Бабенко.
В первой части работы рассматривается функционирование идеографических словарей, электронных словарей и ворднетов и особенности описания лексики в таких ресурсах. Описаны характеристики тропонимических отношений и специфика их установления. Приведен анализ существующих методов выявления семантических отношений на базе различных ресурсов.
Во второй части работы представлены два варианта методов установления гипонимических отношений между глаголами русского языка. Первый метод основывается на принципе лексико-синтаксических шаблонов. За базу взят Национальный корпус русского языка – на материале текстов проводится поэтапный поиск возможных лексико-синтаксических шаблонов, включающих гипоним и гипероним в ближайшем контексте. Обосновывается невозможность использования корпусных данных для установления гипонимических отношений глагольной лексики. Кроме того, описана попытка создания еще одного метода извлечения тропонимических отношений на материале словарных данных. Выделен набор особых лексических маркеров, которые в словарных дефинициях являются своеобразным индикатором гиперонима в определении. С помощью метода проанализирован «Словарь синонимов русского языка» под редакцией Л. Г. Бабенко. Полученные данные показали сравнительно высокую точность. Внесены предложения по дальнейшему совершенствованию метода.
Результаты исследования могут быть использованы в классической лексикографии, компьютерной лингвистике, при разработке программ автоматической обработки текста, электронных словарей и тезаурусов.
В приложении приводится список контекстов из Национального корпуса русского языка, включающих гипоним и гипероним для ста глаголов. Также приведена таблица с указанием глагольных пар, извлеченных из словарных дефиниций, с указанием нашей оценки истинности результата.
В первой части работы рассматривается функционирование идеографических словарей, электронных словарей и ворднетов и особенности описания лексики в таких ресурсах. Описаны характеристики тропонимических отношений и специфика их установления. Приведен анализ существующих методов выявления семантических отношений на базе различных ресурсов.
Во второй части работы представлены два варианта методов установления гипонимических отношений между глаголами русского языка. Первый метод основывается на принципе лексико-синтаксических шаблонов. За базу взят Национальный корпус русского языка – на материале текстов проводится поэтапный поиск возможных лексико-синтаксических шаблонов, включающих гипоним и гипероним в ближайшем контексте. Обосновывается невозможность использования корпусных данных для установления гипонимических отношений глагольной лексики. Кроме того, описана попытка создания еще одного метода извлечения тропонимических отношений на материале словарных данных. Выделен набор особых лексических маркеров, которые в словарных дефинициях являются своеобразным индикатором гиперонима в определении. С помощью метода проанализирован «Словарь синонимов русского языка» под редакцией Л. Г. Бабенко. Полученные данные показали сравнительно высокую точность. Внесены предложения по дальнейшему совершенствованию метода.
Результаты исследования могут быть использованы в классической лексикографии, компьютерной лингвистике, при разработке программ автоматической обработки текста, электронных словарей и тезаурусов.
В приложении приводится список контекстов из Национального корпуса русского языка, включающих гипоним и гипероним для ста глаголов. Также приведена таблица с указанием глагольных пар, извлеченных из словарных дефиниций, с указанием нашей оценки истинности результата.