Google Translate или “живой” переводчик?
В этой статье мы расскажем о главных отличиях “живого” перевода от машинного и поднимем актуальный для многих вопрос: может ли автоматизированный перевод заменить настоящего переводчика?
Сегодня мы являемся свидетелями всё более совершенных разработок автоматизированного перевода, принципиально изменивших повседневную практику и скорости. Поэтому в области перевода всё чаще ставится вопрос о возможности замены человека роботом. В 2016 году в инструменте Google Translate была внедрена система нейронного машинного перевода, и количество грубых ошибок в выполняемом Google переводе сильно снизилось. В связи с этим многие люди, нуждающиеся в услугах письменного перевода, начали задумываться о том, стоит ли платить профессиональному письменному переводчику, если Google может справиться с текстом и на безвозмездной основе. В этой статье рассматриваем «за» и «против» с точки зрения практики и теории перевода.
Что может перевести система нейронного машинного перевода?
Несмотря на существенные недостатки в понимании контекста система машинного перевода в состоянии самостоятельно, без вмешательства редактора-человека, осуществить довольно качественный перевод текстов общей тематики. Это доказывает и недавнее событие: 2 декабря 2020 года была выпущена книга Дэниела Сасскина “Будущее без работы”, полностью переведенная Яндекс.Переводчиком.
Текст общей тематики или несложный в смысловом плане публицистический текст можно назвать максимально подходящим для машинного перевода. Под несложным мы в данном случае понимаем текст с минимальным содержанием риторических тропов (метафор, эвфемизмов, метонимии и проч.), а также с максимально прямой передачей смысла, без использования контекстных приёмов, инверсий, отсылок к внешним текстам и проч. На подобных текстах и обучаются нейронные сети. Однако даже здесь важно учитывать ряд таких факторов, как имена собственные, транскрибируемые машиной по ее собственному, “машинному”, чутью, или нетранскрибируемые вовсе, адреса, с которыми робот пока справляется с переменным успехом, а также единообразие терминов - концепция, которую нейронная сеть пока не освоила. Считается, что за последние годы системы машинного перевода научились относительно точно распознавать тему и рему, но как бы мы ни доверяли инновационным технологиям, логические ошибки в выдаваемых переводах по-прежнему присутствуют, хотя в меньшем количестве, чем при первых разработках.
Профессиональные переводчики также могут прибегать к помощи систем машинного перевода в ряде случаев: например, чтобы быстро ознакомиться с содержанием текста перед началом работы или для ознакомления с различными доступными вариантами перевода той или иной языковой конструкции.
В целом, можно сказать, что с передачей основной идеи любого несложного текста, будь он технический или юридический, нейронные сети справляются неплохо. В этом смысле использование гугл и других утилит сильно помогает в ежедневной работе, когда необходимо получить общее представление о содержащейся в иностранном тексте информации. Но в силу того, что пока они не способны считывать стилистические и смысловые тонкости, для более важных и ответственных задач их использование чревато последствиями.
Что НЕ может перевести система нейронного машинного перевода?
Будучи лишенной эмоционального компонента, машина не способна понять весь спектр смыслов, вкладываемый автором текста в то или иное слово. Эмоциональные аспекты исходного текста неизбежно искажаются или утрачиваются. Соответственно, тексты, несущие в той или иной степени художественный характер – киносценарии, субтитры, романы, рассказы, но также и деловые тексты - предложения, презентации - системам машинного перевода неподвластны. На выходе получается текст из буквализмов, требующих существенной редактуры и переработки.
Другой группой проблем являются искажения, логические и смысловые ошибки автоматизированного перевода: с ними также неизбежно приходится иметь дело.
Отдельно следует сказать о переводе юридических текстов (договоры, уставы, выписки и т.д.). У многих складывается впечатление, что с такими шаблонными материалами машина должна справиться в силу того, что юридический язык является достаточно формализованным и строгим, к тому же ему чужды тропы и фигуры речи. Действительно, структура будет сохранена, а смысл, в значительной части случаев, передан. Особенно Вас сможет порадовать обилие юридической терминологии, которой свободно оперируют те же Deepl и Google Translate. Однако нужно помнить, что при переводе юридических текстов необходимо единообразие терминологии, а сравнив оригинал с предлагаемым машинным переводом, Вы, вероятнее всего, обнаружите полное отсутствие оного.
Другой проблемой для перевода юридических текстов с помощью автоматизированных инструментов является необходимое для переводчика-юриста знание объёма значений используемых терминов. Понимание сути терминов в контексте правовых норм конкретной страны позволяет переводчику передавать заложенный смысл максимально точным из доступных способов, в частности, при невозможности использования конкретного слова для перевода ввиду отсутствия в целевом языке такого слова (распространённая ситуация в юридическом переводе). С подобной частой проблемой автоматизированные системы перевода на сегодняшний день справиться не способны: они просто предлагают наиболее подходящее из имеющихся в словаре слов-эквивалентов, содержание которых может совсем не соответствовать исходному термину.
Машинный перевод на русский язык
Важно понимать, что перевод на русский язык является одной из слабых сторон подобных google.translate систем в силу истории разработки алгоритма автоматизированного перевода. Изначально все переводы осуществлялись через перевод на английский, то есть, если Вы выбирали языковую пару “французский-русский”, то система переводила сначала с французского на английский, а затем с английского на русский. Такое “посредничество” во многом обусловлено универсальностью английского языка в мире программирования. В итоге, мы сталкиваемся с серьезной проблемой: с русского языка на иностранный перевод может быть сравнительно неплохим, а в обратную сторону – крайне слабым. Соответственно, полагаться полностью на системы машинного перевода при переводе на русский язык стоит с повышенной осторожностью, если вы не хотите потратить часы на редактуру и на выяснение, откуда взялось, к примеру, выданное нейросетью слово “абсолютельно” (взято из практики курьёзов гугл переводчика).
Если говорить об уровнях перевода и принципах эквивалентности, то машинный перевод на сегодняшний день способен работать с базовым уровнем – передачей общего смысла. Наилучшим образом он справляется с этой задачей в простых по своей организации текстах. При этом рассчитывать на другие уровни эквивалентности и приведение к нормам целевого языка (жанровым, стилистическим, фразеологическом и других – не приходится).
Постредактирование машинного перевода: за и против?
Как правило, постредактирование машинного перевода считается более простой и, следовательно, более дешевой услугой. Тем не менее, как любят говорить переводчики, все зависит от контекста. И это действительно так, с текстами общей тематики, возможно, постредактирование будет оптимальным вариантом, ведь редактировать придется немного, в основном, редактор будет исправлять стилистику. Однако во всех других случаях постредактирование машинного перевода может значительно усложнить работу по сравнению с обычным письменным переводом.
Почему же так происходит, если машина выдает готовый перевод, а редактору "всего лишь" нужно исправить "пару моментов"? Во многих случаях переводить “вживую” оказывается быстрее. За автоматизированным переводом редактор традиционно проверяет и исправляет падежные окончания, имена собственные, адреса; на практике это всегда занимает немало времени. Но к этой работе может добавиться необходимость сверки с оригиналом текста для понимания смыслового соответствия перевода – в этом случае времязатраты увеличиваются кратно и исправление такого перевода занимает больше времени, чем перевод с нуля силами обычного переводчика.
На наш взгляд, переводчик должен работать по своему усмотрению и определять по ситуации необходимость использования автоматизированного перевода, применительно к конкретному тексту. Если говорить о команде переводчиков IdeaTranslate, то при текущем уровне работы машинных систем перевода их использование практически не применяется. Но, повторимся, это вполне эффективно в ряде случаев и должно оставаться на усмотрение переводчика.
Популярные инструменты машинного перевода
На сегодняшний день нам доступны различные системы машинного перевода, каждая из которых имеет свои особенности и сильные стороны.
- Google Translate. Всемирно известный инструмент, совершенствующийся каждый год. Алгоритмы работы местами загадочны. В частности замечано, что google translate может изменить перевод текста, если в конце переводимого предложения поставить или убрать точку.
- Яндекс.Переводчик. Российский аналог Google Translate, справляющийся с переводом на русский язык в разы лучше своего американского брата-близнеца. Однако для перевода на иностранные языки пока отстаёт.
- Deepl. Одна из наиболее совершенных систем нейронного машинного перевода на сегодняшний день, которая, тем не менее, позволяет себе периодически изобретать новые, неизведанные доселе слова и обороты, лишь отдаленно напоминающие русский язык. Знаменитая языковедческая “глокая куздра” - это к Deepl.
- PROMT. Одна из старейших систем машинного перевода, также переведенная на нейросети в 2015 году. Эту систему удобнее всего использовать для работы с важной документацией, поскольку она поддается настройке и адаптации.
Сравнение машинного и “живого” переводов: некоторые примеры
Сложно понять все минусы и плюсы машинного перевода, не разобравшись с ними на примерах. Помня об ограничениях и особенностях наиболее популярных систем машинного перевода, взгляните на данный пример перевода предложения общей тематики, но с очевидной эмоциональной составляющей.
Оригинальный текст: According to US psychologist Charles Schaefer, we are never “more fully alive, more completely ourselves, or more deeply engrossed in anything than when we are playing”.
Перевод Google Translate: По словам американского психолога Чарльза Шефера, мы никогда «не живем более полно, полностью сами или более глубоко поглощены чем-либо, чем когда мы играем».
Перевод Deepl: По словам американского психолога Чарльза Шефера, мы никогда не бываем "более полны жизни, более полны самих себя или более глубоко во что-либо не втянуты, чем когда играем".
Перевод Яндекс.Переводчика: По словам американского психолога Чарльза Шефера, мы никогда не бываем ”более полными жизни, более полными самих себя или более глубоко погруженными в что-либо, чем когда мы играем".
“Живой” перевод: По словам американского психолога Чарльза Шефера, лишь когда мы играем в игры, “мы чувствуем себя настолько преисполненными жизненной энергии, настолько чутко ощущаем самих себя, и с таким интересом погружаемся в процесс”.
На данном примере мы видим, что все три системы машинного перевода выдали неудовлетворительные буквалистичные варианты, лишенные авторской прагматической позиции, а в переводе Google Translate присутствует бессмыслица, затрудняющая понимание. Обнаружилась также и проблема Яндекс.Переводчика, интуитивно расставляющего знаки препинания без пробелов. Эмоцию не смог передать ни один онлайн-переводчик, однако общий смысл, что и требовалось доказать, был успешно передан.
Посмотрим, как справляются системы машинного перевода с более сложными текстами юридической тематики, оставив лишь “финалистов” предыдущего этапа - Яндекс и Deepl, не допустивших серьезных ошибок.
Оригинальный текст: Any breach of the foregoing warranties in this Section 1 must be reported promptly upon the Customer becoming aware of such breach, and in any event, prior to expiration of the applicable warranty period.
Перевод Deepl: О любом нарушении вышеизложенных гарантий, изложенных в данном Разделе 1, должно быть сообщено незамедлительно после того, как Клиенту станет известно о таком нарушении, и в любом случае до истечения применимого гарантийного срока.
Перевод Яндекс.Переводчика: О любом нарушении вышеуказанных гарантий в настоящем разделе 1 должно быть сообщено незамедлительно после того, как клиенту стало известно о таком нарушении, и в любом случае до истечения применимого гарантийного срока.
“Живой” перевод: О любом нарушении гарантийных обязательств, изложенных выше в настоящем Разделе 1, следует сообщать незамедлительно после того, как Заказчику станет известно о подобном нарушении, и, при любых обстоятельствах, до истечения соответствующего гарантийного срока.
В данном случае мы сталкиваемся с проблемой, о которой говорили выше – единообразие терминов. Ни одна из систем машинного перевода не учитывала контекст и перевела “Customer” как “Клиент”, в то время как профессиональный переводчик, получивший от своего заказчика дополнительный документ с указаниями по стилю, переводит этот термин как “Заказчик”. Тавтологическая конструкция “вышеизложенные гарантии, изложенные в разделе” тоже является ярким признаком дословного машинного перевода. Мы также замечаем и то, что Яндекс.Переводчику пока не подвластен буквенный регистр, что очевидно по его отказу сохранять соотношение заглавных и строчных букв (Раздел 1 и Клиент). Это является важным аспектом в контексте юридических документов, где заглавные буквы указывают на термины, имеющие особый смысл в рамках заключаемого договора, соглашения и т.д. Со смысловым компонентом справились обе машины, однако стилистические особенности и сохранение единообразия не учла ни одна.
Заключение
Как мы можем убедиться, пока мы живем далеко не в радужном будущем, где письменные переводчики более не нужны, а любые тексты успешно может перевести обученная нейронная сеть. Польза таких систем для индустрии переводческих услуг неоспорима, однако им все еще есть к чему стремиться. Системы машинного и автоматизированного перевода могут облегчить работу письменному переводчику, но могут и усложнить. Поэтому важно различать ситуации, когда и где можно прибегнуть к помощи машинного перевода. Они далеки от совершенства, и это необходимо понимать при принятии решения - скопировать и вставить текст в онлайн-переводчик или же обратиться к профессионалам своего дела, которые мастерски передадут все эмоциональные и прагматические компоненты и сохранят единообразие и логику.
В то же время, в повседневной жизни для быстрого понимания основного смысла иностранного текста использование автоматизированных систем имеет неоспоримые преимущества в части скорости и отсутствия стоимости.
Важно понимать пределы возможностей машинного перевода. Сегодня нет необходимости переводить всё с помощью профессионального переводчика – в ряде бытовых ситуаций с этой задачей справится гугл или яндекс или иной инструмент.
Но если мы говорим о качестве, серьёзной работе с текстом, не говоря о сферах, где от перевода зависят решения и действия (юридические, медицинские и прочие), работа письменного переводчика остается незаменимой.