Влияние сегментации текста на качество перевода в САТ-программах
Аннотация
Работа посвящена изучению влияние функции сегментации исходного текста на результат перевода с целью разработки решений по устранению причин ошибочной сегментации. В качестве материала исследования были выбраны идентичные по содержанию инструкции к медицинской технике на английском и немецком языках.
В первой части работы собрана основная теоретическая база САТ-программам и функции сегментации текста. Основное внимание уделяется сегментации текста при автоматизированном переводе. Рассматривается когнитивный аспект переводческой сегментации текста. Проводится обзор существующих исследований в области формализации структуры текста.
Во второй части работы рассматривается практическая сторона работы пользователя САТ-программы и анализируются результаты сегментации текстов инструкций. Основным методом анализа и поиска ошибок сегментации является сопоставительный анализ. Кроме того, отмечаются возможные как лингвистические, так и формальные причины некорректного членения текста. Особую роль как в практический, та и в теоретической части играет пунктуация как основа сегментации текста, на основе правил которой предлагается усовершенствовать алгоритмы деления текста на линейные единицы. Так как программы автоматизированного перевода используются в прикладных целях, связанных с автоматической обработкой текста, поиск ошибок отдельных функций программы для последующего их устранения крайне важен. Немаловажным является и факт воздействия представленного в виде набора элементов текста на целостное восприятие его общей идеи переводчиком, что, в свою очередь, отражается на качестве и скорости перевода.
Результаты исследования представлены в качестве методических рекомендаций по работе с САТ-программой, предназначенных для пользователей, и возможных технических решений по усовершенствованию механизма сегментации текста, которые могут быть использованы для модификации программного кода. Результаты исследования представляют ценность в различных областях прикладной лингвистики: машинный перевод, когнитивная лингвистика, обучение иностранному языку и др.
В приложении приводятся таблицы результатов сегментации текстов инструкций, полученных с помощью САТ-программы.
В первой части работы собрана основная теоретическая база САТ-программам и функции сегментации текста. Основное внимание уделяется сегментации текста при автоматизированном переводе. Рассматривается когнитивный аспект переводческой сегментации текста. Проводится обзор существующих исследований в области формализации структуры текста.
Во второй части работы рассматривается практическая сторона работы пользователя САТ-программы и анализируются результаты сегментации текстов инструкций. Основным методом анализа и поиска ошибок сегментации является сопоставительный анализ. Кроме того, отмечаются возможные как лингвистические, так и формальные причины некорректного членения текста. Особую роль как в практический, та и в теоретической части играет пунктуация как основа сегментации текста, на основе правил которой предлагается усовершенствовать алгоритмы деления текста на линейные единицы. Так как программы автоматизированного перевода используются в прикладных целях, связанных с автоматической обработкой текста, поиск ошибок отдельных функций программы для последующего их устранения крайне важен. Немаловажным является и факт воздействия представленного в виде набора элементов текста на целостное восприятие его общей идеи переводчиком, что, в свою очередь, отражается на качестве и скорости перевода.
Результаты исследования представлены в качестве методических рекомендаций по работе с САТ-программой, предназначенных для пользователей, и возможных технических решений по усовершенствованию механизма сегментации текста, которые могут быть использованы для модификации программного кода. Результаты исследования представляют ценность в различных областях прикладной лингвистики: машинный перевод, когнитивная лингвистика, обучение иностранному языку и др.
В приложении приводятся таблицы результатов сегментации текстов инструкций, полученных с помощью САТ-программы.