КИТАЙСКО-РУССКИЙ ПАРАЛЛЕЛЬНЫЙ ДИСКУРСИВНЫЙ КОРПУС ОФИЦИАЛЬНО-ДЕЛОВЫХ ТЕКСТОВ: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ И ОПЫТ СОЗДАНИЯ
Аннотация
Данная работа посвящена созданию параллельного китайско-русского дискурсивного корпуса официально-деловых текстов в соответствии с требованиями углубления обработки естественного языка особенно совершенствования баз машинного перевода. Работа состоит из введения, трех глав, заключения, библиографического списка и приложений. В работе были охарактеризованы различные подходы к формальному анализу дискурсивной структуры текста, выявлены их сходства и различия, в том числе различия американской, российской и китайской методологии; представлена характеристика официально-делового стиля в приложении к китайским и русским текстам; установлены принципы выбора материала для параллельного китайско-русского дискурсивного корпуса официально-деловых текстов, принципы выравнивания и дискурсивной разметки; уточнена система терминов для параллельной разметки, используемую при создании данного корпуса; проанализированы теоретические характеристики основных элементов дискурсивно-структурной разметки, в их числе —элементарная дискурсивная единица (клауза), абзац, дискурсивные коннекторы и дискурсивные отношения; проведен анализ текстов на дискурсивном уровне: охарактеризованы русские синтаксические аналоги китайских клауз, дискурсивные (логико-семантические) отношения для описания связей между дискурсивными единицами и подтверждены выводы статистическими данными. В созданном корпусе выделено 1210 пар китайских клауз и русских синтаксических аналогов, в том числе 19510 текстоформ китайского и 13097 текстоформ русского языка. В настоящей работе соотнесены различные синтаксические и семантические научные традиции — как русские и китайские, так и американские. Получила свое развитие новая научная терминология: дискурсивный корпус, клауза, дискурсивная структура, элементарная дискурсивная единица, дискурсивный коннектор и дискурсивное отношение. Разработаны и апробированы принципы выравнивания текстов в параллельном корпусе на уровне клаузы. Результаты исследования вносят серьезный вклад в корпусную лингвистику, теорию перевода, сопоставительное языкознание, а также могут быть использованы в практике дальнейших научных исследований в области машинного перевода, автоматической обработки текста, обучения иностранному языку (в данном случае — русскому и китайскому).