Анализ работы программ онлайн-перевода с художественными текстами (на примере Google Translate и Яндекс.Переводчик)
Аннотация
Работа посвящена анализу качества перевода с британского английского языка, выполненного с помощью программ машинного перевода Google Translate и Яндекс.Переводчик, на русский язык и сравнению результатов работы этих систем с традиционным переводом. Материал исследования составили фрагменты из произведений известных английских писателей: «Приключения Оливера Твиста» Чарльза Диккенса, Этюд в багровых тонах» Артура Конан Дойла, «Хоббит, или Туда и обратно» Джона Р. Р. Толкина, «Цвет волшебства» Терри Пратчетта и «Гарри Поттер и Дары Смерти» Джоан Роулинг. Всего проанализировано 466 предложений и соответствующих им переводов.
В первой части работы рассматриваются такие понятия, как «перевод», «адекватность перевода», «эквивалентность перевода», описываются основные принципы и приемы традиционного перевода, далее говорится об особенностях автоматического перевода и работе нейронных и гибридных систем.
Во второй части работы приводятся результаты сравнительного анализа традиционного и машинного переводов, а также сопоставительного анализа фрагментов оригинального текста на английском языке и его переводов на русский язык. Проанализирована работа двух популярных в России программ: Google Translate и Яндекс.Переводчик. Первая использует нейросети, вторая система является гибридной и сочетает в себе принципы работы нейросетей и статистического перевода.
При выполнении работы проанализированы ошибки, допускаемые программами, и выяснено, что большинство из них связано с буквальным и дословным переводом. Также приводятся причины, по которым возникают те или иные ошибки. В результате анализа было выявлено, что программа Яндекс.Переводчик отличается более высоким качеством перевода. Количество адекватно переведенных предложений в переводе Яндекса в два раза больше, чем в переводе Google Translate (18% против 9%). Это можно объяснить тем, что гибридная система, на которой основана программа Яндекс.Переводчик объединяет в себе сильные стороны сразу двух подходов – статистического и нейронного переводов.
Результаты исследования могут быть использованы при разработке подходов для повышения качества работы систем машинного перевода в различных парах языков.
В первой части работы рассматриваются такие понятия, как «перевод», «адекватность перевода», «эквивалентность перевода», описываются основные принципы и приемы традиционного перевода, далее говорится об особенностях автоматического перевода и работе нейронных и гибридных систем.
Во второй части работы приводятся результаты сравнительного анализа традиционного и машинного переводов, а также сопоставительного анализа фрагментов оригинального текста на английском языке и его переводов на русский язык. Проанализирована работа двух популярных в России программ: Google Translate и Яндекс.Переводчик. Первая использует нейросети, вторая система является гибридной и сочетает в себе принципы работы нейросетей и статистического перевода.
При выполнении работы проанализированы ошибки, допускаемые программами, и выяснено, что большинство из них связано с буквальным и дословным переводом. Также приводятся причины, по которым возникают те или иные ошибки. В результате анализа было выявлено, что программа Яндекс.Переводчик отличается более высоким качеством перевода. Количество адекватно переведенных предложений в переводе Яндекса в два раза больше, чем в переводе Google Translate (18% против 9%). Это можно объяснить тем, что гибридная система, на которой основана программа Яндекс.Переводчик объединяет в себе сильные стороны сразу двух подходов – статистического и нейронного переводов.
Результаты исследования могут быть использованы при разработке подходов для повышения качества работы систем машинного перевода в различных парах языков.