Автоматизация перевода—миф или реальность?

XXIII Международный конкурс научно-исследовательских и творческих работ учащихся
Старт в науке

Автоматизация перевода—миф или реальность?

Эфендиева К.Ф. 1
1МБОУ «ШСОШ №1»
Максимова В.В. 1
1МБОУ «ШСОШ №1»
Автор работы награжден дипломом победителя II степени
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
     

Введение

Существует множество видов письменного перевода: технический, медицинский, юридический и т.д. Для своей исследовательской работы я выбрала художественный перевод, так как он не требует специальных знаний и терминов, а также отлично подходит для наглядного сравнения.

Обоснование выбора темы: Мне интересна данная тема, так как я планирую поступать на переводчика и хочу связать свою жизнь с переводами. В выборе темы я также ориентировалась на свой профиль—гуманитарный, с профильными предметами английский и обществознание.

Актуальность проекта:

В современном мире активно идёт процесс автоматизации, который затронул и сферу перевода, поэтому очень важно понимать, какие профессии будут актуальны в будущем, а какие неизбежно устаревают. Кроме того, в наши дни часто ведутся споры о том сможет ли ИИ заменить письменных переводчиков или же нет. Своими исследованиями я хочу поставить точку в этом вопросе.

Гипотеза: в ближайшем будущем ручной перевод заменят нейросеть и автоматизированные переводчики

Цель проекта: Исследование различных механизмов художественного перевода и поиск наиболее эффективного.

Задачи:

1.Самостоятельно осуществить перевод адаптированной под мой уровень версии известного произведения (классики) и нового, непереведённого произведения fan fiction.

2.Осуществить перевод этих же произведений через Google переводчик и нейросеть DeepL.

3.Провести сравнение по определённым критериям моих собственных переводов с переводами, сделанными посредством Google переводчика и нейросети DeepL

4.Описать результаты сравнения.

5.Сделать вывод, подтвердить или опровергнуть гипотезу.

Методы исследования:

  1. Эксперимент

  2. Сравнение

  3. Анализ

  4. Индукция

Практическое применение работы:

Практическая значимость проектной работы состоит в том, что разработанные рекомендации могут быть использованы в работе профессиональных письменных переводчиков и переводчиков-любителей, а также в работе различных издательств.

Теоретическая часть

Глава 1. Общие сведения об объекте исследования

1.1. Историческая справка о письменном переводе

Первые упоминания о письменных переводах находят в Древнем Египте, в XV веке до нашей эры.

Три с половиной тысячи лет назад некий неизвестный жрец сделал перевод дипломатической переписки с древнеегипетского языка на аккадский, записав свою работу клинописью. Это самый старый памятник истории, дошедший до наших дней, однако предполагается, что письменный перевод египтяне делали и задолго до него.

Изображения переводчиков находят на барельефах, сделанных больше 5000 лет назад! К тому времени египтяне уже отлично знали письменность, а значит, будет резонно предположить, что и история письменного перевода уже началась.

Были свои переводчики и в других древних государствах. Например, выпускники шумерских школ свободно переводили с шумерского на аккадский, а настоящих специалистов в этой сфере называли «драгоманами».

Свои переводчики были у царя, в храмах, у военных и т. д. Не отставали от соседей и хетты: сохранились сделанные ими переводы с хурритского на хеттский, а также целые шумеро-аккадо-хеттские словари! Написаны они около 3500 лет назад.

После падения Рима, в Средние века, письменный перевод стал уделом монахов. Их позиция была прямо противоположна воззрениям Цицерона: слово считали сакральным, его иконическую природу – нерушимой, поэтому перевод делали строго буквально.

И, наконец, в эпоху Возрождения определяется практически современный подход к письменному переводу.

Возникают разные школы переводчиков, появляются переводы светской литературы, ведутся дискуссии о балансе между передачей смысла и сохранением формы текста. Явление письменного перевода становится по-настоящему массовым.

На Руси письменный перевод развивался тем же путём, что и в Европе. Знаковой точкой стало правление Петра I, создавшего Академию, а при ней «Российское собрание» — первую организацию профессиональных переводчиков в России.

Ну а столетием позже Жуковский, Карамзин и Лермонтов возвели письменный перевод в статус настоящего искусства.

1.2. Понятия Google-переводчика и нейросети DeepL

Переводчик Google — это сервис для перевода, и при этом это почти что инструмент для общения с иностранцами, автономный переводчик и одновременно путеводитель. Он позволяет пользователям переводить текст, веб-страницы и документы с одного языка на другой. Сервис поддерживает более 100 языков, что делает его универсальным и широкодоступным инструментом для решения переводческих задач. Помимо этого, при доступе к Сети сервис предлагает распознавание текста, аудио, рукописный ввод. Он способен выстраивать целые диалоги, а при переводе веб-страниц не нарушает их форматирования.

Основные возможности переводчика от Google:

  • Перевод на 109 языков.

  • Перевод своих текстов и слов собеседника напрямую во время разговора.

  • Перевод разными способами — разговор, текст, рукописный ввод или с фотографий.

  • Перевод в любых ситуациях: в дороге, на отдыхе или на встрече без Интернета.

  • Сохранение вариантов перевода и синхронизация их с мобильными устройствами.

DeepL Translator — это сервис машинного перевода, разработанный немецкой компанией DeepL GmbH. В данном переводчике есть возможность разметить и отредактировать исходный текст. В количестве доступных языков переводчик DeepL уступает своим конкурентам, в его языковом портфеле есть основные европейские языки и пару азиатских. Нейросеть имеет собственный словарь определений, а также продвинутые инструменты для проверки орфографии, пунктуации и грамматики. Как пишет сама компания DeepL: «Нейронные сети DeepL способны улавливать даже самые тонкие оттенки значений и воспроизводить их в переводах так, как не удавалось еще ни одной другой системе.» и «Переводы от DeepL превосходят по качеству результаты других компаний в соотношении 3:1.»

Основные возможности DeepL:

  • Интерпретировать текстовые сообщения и PDF файлы на разные языки

  • Находить определения слов в встроенном словаре

  • Проверять орфографию и пунктуацию определенных фрагментов

  • Подбирать синонимы, улучшать и перефразировать предложения

1.3. Принципы работы Google-переводчика и нейросети DeepL

Google Translate использует статистический подход к машинному переводу, анализируя закономерности в больших объемах многоязычного текста для создания перевода, то есть в его основе лежит перевод произнесённых фраз В нем используются модели искусственного интеллекта и нейронных сетей, позволяющие со временем повышать точность перевода. Разработчики уже создают систему перевода «на лету», в нём есть офлайн-словари для работы без доступа к Сети и перевод дорожных знаков, на которых достаточно навести камеру своего мобильного устройства.

DeepL Переводчик нередко работает лучше, чем конкурирующие системы от крупнейших технологических компаний. Этому есть несколько объяснений. Как и большинство современных систем машинного перевода, DeepL Переводчик работает на основе нейронных сетей. Эти сети обучаются на огромном количестве готовых переводов. Однако исследователи компании также вносят множество усовершенствований в общую методологию нейронных сетей, в основном в четырех областях. Эти области следующие: архитектура сетей, обучающие данные, методология обучения и размер сетей.

1.4. Области применения

Google-переводчика:

1)Для неформального или общего перевода, например, непринужденных разговоров или простых текстовых фрагментов.

2) В образовательных целях:

На уроке возможны следующие варианты использования Google-переводчика:

a) Разыграть диалог с помощью функции голосового ввода.Данное упражнение имитирует реальную коммуникативную ситуацию, когда в путешествии необходимо быстро перевести информацию для иностранца. Кроме того, вы сможете поработать над критическим мышлением, если попросите ученика проанализировать, насколько удачен перевод от Google.

б) Анализ качества перевода от Google. Можно разделить учащихся на пары, попросить улучшить перевод от Google, что добавит элемент соревновательности на уроке.

в) С помощью Google Translate можно работать над расширением словарного запаса при подготовке к школьным и международным экзаменам. Google Translate предлагает нам списки слов и несколько вариантов перевода. Можно предложить студентам выбрать несколько синонимов из списка, а затем проверить их лексическую сочетаемость и контекст использования по авторитетному словарю (например, Cambridge Dictionary).

Нейросети DeepL:

Программу применяют:

1) копирайтеры при написании статей и проверки грамматики

2) вебмастеры, работающие с зарубежными ГЕО для составления рекламных объявлений

3) студенты и школьники в учебе.

4) Учителя в образовательных целях (так же как Google-переводчик)

Глава 2. Подробные сведения о проекте

2.1. Проблема

С каждым годом технологии развиваются всё стремительнее. Процесс автоматизации и машинизации затронули различные сферы человеческой деятельности: искусственный интеллект и роботов применяют на производстве, в сфере услуг, в освоении космоса и т. д. Не обошёл стороной процесс автоматизации и сферу перевода, так как любой язык—это тоже своего рода структура, которая, исходя их логики, должна поддаваться машинам. В связи с этим возникает угроза устаревания такой профессии как письменный переводчик. Однако, несмотря на это, каждый год сотни выпускников поступают именно на это направление. Необходимо понять, будет ли переводческое дело актуально в будущем и стоит ли профессиональным переводчикам переквалифицироваться в другую специальность, или же они могут быть на пару-десятков лет спокойны. К тому же споры о перспективе переводчиков ведутся постоянно и очень давно, неправильная и непроверенная информация сбивает с толку сотни людей, которые хотят попробовать себя в этом деле. Своими исследованиями я хочу поставить точку в данном вопросе и, возможно, помочь тем, кто стоит на перепутье.

2.2. Требования

В работе должны были использоваться общедоступные механизмы перевода, которыми может пользоваться каждый.

Исследования должны оцениваться объективно, исходя только из фактов, а не из личного отношения и личной заинтересованности.

Выбранные для переводов произведения должны подходить под мой уровень языка, то есть быть не выше уровня B2.

Практическая часть

Глава 3. Исследование и выводы

3.1. Этапы исследования

Шаг 1. В первую очередь я выбрала произведения, которые буду брать для перевода. Первой книгой, которую я взяла для своей работы, стала книга “Долина страха” Артур Конан Дойля. Я взяла адаптированную под мой уровень(B2) версию этой книги, так как оригинальный текст написан на более высоком уровне. Для перевода я выбрала первую глав третьей части.

Вторым произведением, выбранным мной для проекта, должно было стать что-то относительно новое и непереведённое, поэтому мой выбор пал на фанфикшн.(произошло от англ. Fan fiction— фан-литература, фан-проза). Произведение, которое я выбрала, — это фанфик «Incarnate». Фанфик—это жаргонизм, обозначающий любительское сочинение по мотивам популярных оригинальных литературных произведений, произведений киноискусства (кинофильмов, телесериалов, аниме и т.д), а также компьютерных игр и т. д. Я постаралась найти максимально нейтральный фанфик, т.е. не относящийся к какому-то конкретному сериалу, книге и т. д., чтобы максимально сконцентрироваться на самом тексте. В данном произведении я перевела первую главу первой части.

Шаг 2. Самостоятельный перевод фрагментов данных произведений. На этом шаге я, самостоятельно, без использования сторонних средств, за исключением электронного англо-русского словаря, осуществляла перевод данных произведений.

Шаг 3. На третьем этапе нужно было осуществить перевод этих же текстов через Google переводчик и нейросеть DeepL.

Шаг 4. Следующим моим шагом было сравнение всех трёх переводов каждой книги между собой по определённым критериям:

1) Скорость перевода

2) Сохранение авторского слога

3)Грамматика

4) Лексика

5) Пунктуация

Что касается всех критериев, кроме скорости перевода, то я буду описывать самые показательные и важные несоответствия, со всеми же несоответствиями вы можете ознакомиться в приложении, где вы сможете найти оригиналы текстов и их переводы. Расхождения там подчёркнуты красным.

Результаты сравнения:

  1. Скорость перевода посредством Google и DeepL переводчиков намного выше, чем скорость ручного перевода. Если быть точной, то одна страница A4 переводится в течение 3-4 секунд и в одном, и во втором переводчике, в то время как ручной перевод страницы A4 занимает у меня около 40-50 минут.

  1. Всем известно, что одну и ту же информацию мы можем передать двумя способами и автоматизированные переводчики зачастую выбирают наиболее лёгкий способ донесения информации, даже если она нарушает авторский слог. Однако я считаю, что авторский слог необходимо сохранять, так как в нём проявляется индивидуальность и уникальность автора.

Пример: (из фанфика “ Incarnate”)

Оригинал

Мой перевод

Google переводчик

DeepL переводчик

She smiled widely, leaning down to give a tight hug.

Она широко улыбнулась, наклоняясь, чтобы подарить крепкое объятие.

Она широко улыбнулась, наклонившись и крепко обняв.

широко улыбнулась она, наклоняясь, чтобы крепко обнять.

Дело в том, что в английском языке есть обычное слово to hug—обнять, однако в данном случае автор подмечает что тётушка не просто крепко обнимает», а «дарит крепкое объятие» (give a tight hug), что сразу же намекает нам на щедрый и добрый характер нашей героини, что и подтверждается в последующих строках произведения.

  1. Я выделила основные моменты, где машина допускает грамматические ошибки: это род, падеж и уменьшительно ласкательные названия. Говоря про род, в этом нет ничего удивительного, т.к. в английском языке глаголы нейтральны, у них нет родовых окончаний, как, например, в испанском языке.

Насчёт падежей дела обстоят иначе. Приведу конкретный пример:(из фанфика “Incarnate”)

Оригинал

Мой перевод

Google переводчик

DeepL переводчик

She nodded before digging into the pocket of her yellow dress and dropping five silver coins on your hand

Она кивнула, прежде чем покопаться в кармане её жёлтого платья и бросить пять серебряных монет на твою руку

Она кивнула, прежде чем покопаться в кармане своего желтого платья и бросить пять серебряных монет в руке твоей

Она кивнула и, порывшись в кармане своего желтого платья, высыпала вам на руку пять серебряных монет

Мы можем видеть, что нейросеть успешно справилась с падежом, однако переводчик делает в них явные ошибки, не говоря уже о неправильном порядке слов в предложении.

Ещё одна ошибка, которую я заметила, это не распознание уменьшительно ласкательных слов.

Пример: (из фанфика “Incarnate”)

Оригинал

Мой перевод

Google переводчик

DeepL переводчик

deliver milk to Aunty Poppy

доставить молоко тётушке Поппи

доставить молоко тете Поппи

доставить молоко тетушке Поппи

В рамках произведения этот момент играет важную роль, показывая то, что Поппи не злая «тётя» или «тётка», а добрая и любимая «тётушка». Опять же, нейросеть верно перевела данное слово, а вот Google переводчик не смог этого сделать несмотря на то, что слово «aunty», явно отличается от слова «aunt».

  1. В английском языке одно слово может иметь несколько значений, поэтому появляются проблемы с лексикой. Машина часто путает и подставляет правильные, но не соответствующие тексту значения слов.

Пример: (из книги “ The Valley of Fear”)

Оригинал

Мой перевод

Google переводчик

DeepL переводчик

He heard the ringing of the bell which called for the servants of the house

Он услышал звонокколокольчика, который звонил для прислуг дома

Он услышал звон колокола, призывавший слуг дома

Он услышал звонколокольчика, который позвал слуг дома.

Английское слово “bell”—это и колокол и колокольчик, но в данном контексте совершенно ясно, что ни о каком колоколе не может быть и речи. Здесь имеется в виду маленький колокольчик, с помощью которого подзывают слуг дома.

Приведу ещё один пример: (из фанфика “Incarnate”)

Оригинал

Мой перевод

Google переводчик

DeepL переводчик

Aunty Poppy?” You called, your voice small as you are

Тётушка Поппи?— позвал ты, твой голос был таким же маленьким, как и ты

Тётя Поппи? Ты позвонила своим тихим голосом

"Тетя Поппи?" Вы позвали ее, твой голос был таким же маленьким, как и ты сам

Глагол “call” имеет два значения— звонить и звать. Google переводчик не справился с поиском подходящего значения, а также перевёл слово “small”— маленький, как тихий. DeepL переводчик подобрал оба значения верно.

  1. Наиболее частые ошибки возникли с переводом прямой речи, так как правила оформления прямой речи в английском языке немного иные, чем в русском.

Пример: (из книги “ The Valley of Fear”)

Оригинал

Мой перевод

Google переводчик

DeepL переводчик

'Well, it's something,' said Mason.

«Хорошо, это уже что-то,»—сказал Мейсон.

Ну, это что-то, — сказал Мейсон.

'Well, it's something,' said Mason.

Мы можем видеть, что одиночным кавычкам в английском соответствуют двойные кавычки в русском. В русском языке после прямой речи и перед словами автора ставится тире, а в английском не ставится. Смотря на таблицу, можем заметить, что Google переводчик вообще не поставил никакие кавычки в прямой речи, что считается грубой ошибкой. Нейросеть же вообще данное предложение не смогла перевести и просто оставила как есть.

3.2. Выводы по проделанной работе

Проанализировав все переводы двух произведений, можем заключить, что с классикой (адаптированной) Google переводчик и нейросеть DeepL справились с меньшим количеством ошибок, так как в классических произведениях в основном стандартизированный стиль, а так как книга ещё и адаптированная, то она также обладает доступностью изложения. Как только появляется нестандартный креативный текст, как фанфик, у искусственного интеллекта появляются трудности. Однако мы не можем игнорировать тот факт, что переводы нейросети по большей части сошлись с моими, она справилась с тем, с чем не справился Google переводчик. Кроме того, что она перевела текст качественно, так ещё и сделала это очень быстро. Теперь мы можем приступить к выводу исследовательской работы.

На основе проведённого исследования можно сделать вывод, что нейросеть является наиболее эффективным и удобным механизмом перевода в настоящее время. Однако мы также можем утверждать, что нейросеть всё ещё несовершенна и допускает ошибки, поэтому эффективно пользоваться ей можно будет только при совместной деятельности нейросети и человека, который будет корректировать полученный текст. Что же касается гипотезы, то я её подтвердила, однако она нуждается в дополнении: в ближайшем будущем на смену ручному переводу придёт перевод, который будет осуществляться совместно нейросетью и человеком.

Заключение

В результате работы были исследованы современные механизмы перевода.

Мной были выполнены следующие задачи:

1. Осуществление самостоятельного перевода главы из адаптированной версии книги Артура Конана Дойля “Долина страха” и фанфика “ Воплощённый”.

Данная задача была решена благодаря использованию электронных версий данных произведений и электронного англо-русского словаря.

2.Осуществление перевода этих произведений через Goggle-переводчик и нейросеть DeepL.

Данная задача была решена посредством копирования оригинального текста из электронных версий произведений и его вставку в поля ввода Google-переводчика и нейросети DeepL.

3. Сравнение по определённым критериям мои собственные переводы с переводами, сделанными посредством искусственного переводчика и нейросети.

Данная задача была решена путём выделения моментов несоответствия, их анализу и сравнению по таким лингвистическим и нелингвистическим критериям, как: скорость перевода, сохранение авторского слога, грамматика, лексика и пунктуация.

4.Описание результатов сравнения.

Данная задача была решена путём структурирования полученных в результате исследования данных в таблицы Word.

5. Подтверждение или опровержения гипотезы

Данная задача была решена при помощи сравнения изначальной гипотезы с выводами исследования.

В результате выполненной работы гипотеза подтвердилась, все задачи работы были выполнены, цель работы достигнута.

Итоговым продуктом работы стала папка, содержащая все переводы, в количестве 8 штук. (внешний вид продукта смотреть в приложении)

 

Список информационных источников

https://www.quotev.com/

https://2books.su/books/the-valley-of-fear-adapted/

https://translate.google.iq/?hl=ru

https://www.deepl.com/translator

https://dictionary.cambridge.org/

https://dzen.ru/a/Yu1MDPHDBwZyR6bX

https://linguacontact.com/blog/vidy-osobennosti-i-problemy-pismennogo-perevoda/

https://startpack.ru/application/google-translate#:~:text=Переводчик%20Google%20—%20это%20сервис,навести%20камеру%20своего%20мобильного%20устройства

https://barrazacarlos.com/ru/advantages-and-disadvantages-of-google-translate/

https://skyteach.ru/survey/google-translate-silnye-i-slabye-storony-stoit-li-polzovatsya-servisom/

https://www.deepl.com/ru/blog/how-does-deepl-work

Приложение. Итоговый продукт и создание памятки

Итоговый продукт проекта—папка со всеми собранными переводами, использованными в процессе исследования.

В результате проведённых исследований я создала буклет-памятку, рассказывающую о том, на какие моменты стоит обратить внимание при корректировке текста, переведённого Google переводчиком и нейросетью DeepL. Я считаю, что эта памятка будет полезна как для переводчиков-корректировщиков, так и для обычных пользователей.

     
Просмотров работы: 22