покращив

Google Translate все ще перекладає "смажений сир і небо", але "покращує".

Якщо ви нещодавно перекладали через Google Translate, можливо, ви помітили, що переклад зі словацької на англійську та навпаки є кращим. Компілятор використовує нові та вдосконалені технології.

До 19 квітня Google використовував так звану статистичну систему, яка перекладала текст за заздалегідь визначеними граматичними шаблонами. Нещодавно він використовує нейронні мережі, які дозволяють системі навчитися перекладати тексти, щоб результат був ближчим до природного людського мовлення. Краще сказати, щоб зробити результат більш схожим на тексти, які вони дали йому для навчання.

Ми перевірили нову технологію на різних текстах в редакції та порадились з результатами з професійними перекладачами.

Хоча Google Translate і досі перекладає фразу "смажений сир та небо" як "смажений сир та небо", в іншому випадку вона покращилась у кількох аспектах. Новий нейронний переклад дозволяє перекладати цілі речення відразу, а не потроху. Він використовує ширший контекст навколо слів і, отже, пропонує більш підходящий переклад. Поліпшення якості повинно бути помітним, особливо при довших реченнях. Google заявляє, що нова технологія може усунути помилки перекладу на 55-85 відсотків.

"На рівні самого речення він уже може флексувати словацькою мовою, він знає, який прийменник асоціюється з дієсловом, у цьому є великий зсув. Але йому все ще бракує свідомості читача, якої має лише людина ", - говорить Ана Остріхонова, перекладач та засновник видавництва Inaque.

В Інтернеті є безліч прикладів того, які дурні помилки дотепер робив Google Translate. Наприклад, він переклав фразу "не лебідь" як "не розбуди лебедя". Сьогодні він пропонує дві можливості - буквальний переклад "не будь лебідь", а також як фразеологізм "не будь дурним" (не будь дурним). Перекладаючи з чеської, він знає третє значення "давай" (ти можеш це робити, ти робиш прогрес, не соромся).

На графіку відображається рейтинг користувачів перекладів з англійської на іспанську, французьку, китайську та навпаки. Переклад з французької на англійську показує, що нейронний переклад (зелений) сприймається майже так само, як переклад середньостатистичного двомовного перекладача (оранжевий). На сьогодні переклад на китайську та з китайської мови гірший, але нейронний переклад значно покращив оригінальний статистичний переклад (синій). Джерело: research.googleblog.com

Система навчається сама

Google щодня реєструє близько одного мільярда перекладів. Щодня він перекладає 140 мільярдів слів, набраних понад 500 мільйонами людей.

Компанія представила нову технологію в листопаді минулого року, коли запустила нейронні переклади для перших восьми світових мов - німецької, французької, іспанської, португальської, китайської, японської, корейської та турецької. Сьогодні нові переклади працюють між англійською та понад двома десятками мов. З квітня серед них і словацька.

Нейронний переклад не вчиться у людей, а сам аналізує перекладені тексти і вчиться у них. При цьому окремі мови не викладаються окремо, а обробляються кількома одночасно. Це схоже на людину, якій, якщо вона знає романську мову (французьку чи іспанську), легше вивчити іноземну мову іншого родича (португальська чи італійська).

"Нейронні мережі перекладають цілі речення і потребують величезних обчислювальних потужностей. Google перекладає з 103 мов, і якби нам довелося створювати окрему модель для кожної комбінації, апаратне забезпечення не затягувало б її ", - сказав Барак Туровський, менеджер з продуктів Translator, SME. "Тому ми об'єднуємо мови в групи. В ідеалі це подібні в лінгвістичному плані мови, такі як слов’янська чи індійська ".

Перекладач Остріхонова каже, що перекладач сьогодні набагато розумніший, ніж був протягом трьох-чотирьох років. Водночас він додає, що переклад дуже буквальний і не регулює стилістику. Сам переклад слів з однієї мови на іншу мінімальний. "Але тут є регістр, стиль, різні мовні рівні, які оповідачі використовують у діалогових вікнах, - Google Translate не знає цього".

Її слова підтверджує Мартін Кубуш, який читає лекції в університеті Матея Бела з англійської літератури та перекладу художніх текстів: «Google не має стратегічної компетенції, ані соціально-лінгвістичної компетенції. Він має лише мовну базу - він обмінюється мовним матеріалом ".

За його словами, компілятор не може декодувати стиль, він не має хорошого синтаксису. "Це корисно для людини, якій потрібно зробити потворний грубий переклад, але для художнього перекладу цього недостатньо. Це вимагає від людини, яка може придумати відповідну стратегію, щоб заплатити за певний уривок тексту ".

"Напевно, жодна мова не може бути зведена до правил, якими може користуватися програмне забезпечення", - додає Остріхонова. "Крім того, мова змінюється і розвивається щодня, слова набувають різних відтінків".

Які помилки допускає новий перекладач Google у перекладах?

Іноді він навіть не перекладає простий текст

Очевидно, що в системі все ще є помилки, які унеможливлюють переклад навіть простого тексту.

Перекладач Google: У Мексиці від нього не дістатись. Смерть. Кров. Біль. Катування всюди.

Правильний переклад: Ви не втечете від нього в Мексиці. Смерть. Кров. Біль. Катування на кожному кроці.

Деякі речення перекладаються неправильно, оскільки не бачать їх у контексті

Деякі речення помилкові, оскільки вони не перекладаються в контексті цілого абзацу чи сторінки. Як результат, вони не мають сенсу.

Перекладач Google: "Це не має сенсу."
- Ну, так.

Правильний переклад: "Це не має сенсу"
"Так."

Це привласнює без потреби

"Англійська, німецька, французька часто привласнюються - наприклад," вона забрала свої речі "," він пішов до своєї кімнати ". Ми перекладаємо це словацькою мовою, коли він пішов до своєї кімнати ', або `` він пішов до своєї кімнати' ', - пояснює Остріхонова. "У неї немає почуття мови. Він не знає, що суттєве в одній мові може не мати суттєвого значення в іншій, чи це просто граматична функція, яка не переноситься на іншу мову або перекладається лексично чи стилістично ".

Перекладач Google: Коли оператор нарешті задзвонив у кімнату, вона сиділа на сидінні біля вікна, майже закінчуючи лак лівої лівої руки.

Правильний переклад: Коли в її кімнаті нарешті пролунав дзвоник, вона сиділа біля вікна, фарбуючи майже всі цвяхи на лівій руці.

Він повторює деякі слова в перекладі без потреби

Google повторює деякі слова, хоча це не потрібно у перекладі. "Він просто обмінюється мовними матеріалами і взагалі не враховує деяких особливостей словацької мови", - говорить Кубуш.

Перекладач Google: "Хто це говорить?"
- Коммодор так каже.

Правильний переклад: "Хто сказав?"
"Комодор".

Проблеми з персонажами та їх іменами

Google часто не може зрозуміти, який характер має цей персонаж в історії. Навіть якщо персонаж був введений, у наступному реченні система може більше не знати, дівчинка це чи хлопчик. Він також іноді не може обробляти імена персонажів - іноді залишає їх у оригінальній версії, перекладає їх на кілька рядків нижче. Позитивним є те, що він нахиляється, тому він знає, що йому слід використовувати суфікс -ová для жіночих прізвищ.

Якщо він не може щось перекласти, він буде використовувати чеську

У ситуаціях, коли Google не справляється з перекладом слова, воно потрапляє на чеську мову.

Перекладач Google: - Привіт, - сказала вона, простягнувши пальці лівої руки і відірвавшись від білих шовкових шат.

Правильний переклад: - Будь ласка, - сказала вона, простягаючи ліву руку якомога далі від білого шовкового халата.

Переклад є штучним та недоречно дослівним

Деякі переклади є буквальними, хоча на словацькій мові деякі речі будуть сказані інакше. Таким чином, навіть якщо Перекладач не робить граматичної помилки, переклад є недоречним. "Це штучно. Немає тлумачення перекладача ", - говорить Кубуш.

Перекладач Google: Це не його природа

Правильний переклад: Це не в природі.

Він не знає, хто такий актор

У ситуаціях, коли в літературі прямо не вказано, хто що зробив, Перекладач губиться.

Перекладач Google: Я чув, як Чарлі піднімався сходами і стрибав у ліжко, вдаючи, що спить. Він закрив голову в кімнаті і сказав моє ім’я, але я не відповів.

Правильний переклад: Я почув, як Чарлі піднімався сходами і кинувся в ліжко, коли міцно спав. Він зазирнув до кімнати і звернувся до мене, але я не відповів.

Знаки пунктуації

Компілятор іноді допускає безглузді пунктуаційні помилки. Іноді ви неправильно вставляєте пробіл між словом та заключним лапкою. Він також неправильно вставляє пробіл між словом та наступними трьома крапками, хоча ця помилка не траплялася у вихідному тексті. Бувало також так, що крапку він замінював комою, хоча наступне слово залишав з великої літери, ніби це було початком речення.

У нього проблема із застарілими словами

Деякі старіші слова еволюціонували, і їх значення поступово змінювалося. Однак Google Translate не може датувати текст, тому він не знає, який переклад використовувати. У нього були проблеми, наприклад, коли ми попросили його перекласти текст із книги "Дев'ять оповідань", написаної Дж. Д. Селінджером у 1953 році.

Перекладач Google: Вона зняла два щойно з’явилися волосся на шиї.

Правильний переклад: Вона витягла з вивіски два маленькі волоски.

Він не знає, що словацька вже не має вокативу

Google часто не може використовувати правильний стиль. Під час тестування з нами трапилось, що він використав 5-й футляр, хоча він майже не існує у словацькій мові.

Перекладач Google: "Мамо, кохана, не кричи на мене, я чудово тебе чую", - сказала дівчина.

Правильний переклад: "Мамо, дорога, не кричи на мене. Я вас чую дуже добре ", - сказала дівчина.

Це ще не замінить перекладачів

Тестування нового Перекладача показує, що найближчим часом технології не замінять професійних перекладачів. Система все ще допускає помилки, яких не робив би пересічний перекладач чи перекладач.

"Ми, перекладачі, все ще можемо бути в мирі. Ця нещасна машина нас поки не замінить ", - говорить перекладач Мартін Кубуш. Він вважає, що Google Translate повинен легко перекладати інформативні тексти, де переклад перекладача не потрібен, такі як посібники та інструкції з використання.

"Існує різниця між експериментально-експресивним текстом та інформативним текстом. Google може перекласти деякі шаблонні контракти, можливо, він впорається з так званою сірою літературою Європейського Союзу, але навіть там це, мабуть, все одно потребує коригування ", - говорить він. "Але що стосується інтерпретації тексту, додавання чогось незрозумілого, скорочення чогось, система цього не знає".

Google Translate не тільки не замінює перекладачів прекрасної літератури, але поки що на нього не можна покладатися навіть у тих областях, де мова, що використовується, простіша. У професійних, технічних, фінансових чи юридичних текстах граматика часто простіша, але навіть незначні помилки неприпустимі.

Крім того, автори нового Перекладача визнають, що нова технологія перекладу може в деякі моменти бути менш точною, ніж старий спосіб фактичного перекладу від слова до слова. Система намагається знайти найкращий звуковий переклад і може мати проблеми, наприклад, з перекладом рідко вживаних слів. Іноді у вас може не вийти перекласти всі слова.

Майбутнє Перекладача також залежить від якості двомовних текстів, з яких система буде продовжувати вчитися. Використання нейронних мереж для перекладу справді є серйозною і суттєвою технологічною зміною, але якщо програмне забезпечення вчиться на погано перекладених текстах, воно може навчитися і поганим шляхам.