Praha phone 734 447 000Brno phone 604 279 594Plzeň phone 732 189 777

Strojový překlad je dobrý sluha… A dál?

Martin Štulík

Strojové překladače v současné době už dokáží v mnoha ohledech nahradit neodbornou lidskou práci. Skutečně kvalitní a spolehlivý překlad ale od nich nečekejme. K tomu je nutný kvalifikovaný překladatel, který by se měl naučit se strojem pracovat a využívat jej, jako jeden z mnoha zdrojů, ke všeobecnému prospěchu.

Pár slov úvodem

 

Taky vám přišlo vždycky trochu divné, že v kultovním seriálu Star Trek – ostatně jako ve většině sci-fi – mluví příslušníci všech možných i nemožných ras plynně anglicky, potažmo česky? Jak je to možné? Filmaři tuhle vypravěčskou berličku převlékli za technologickou vymoženost zvanou „univerzální překladač“. (Milovníci Douglase Adamse a jeho světa si sem dosadí „babylonskou rybku“.)

Do poloviny 23. století, kdy se statečný kapitán Kirk připojí k Hvězdné flotile, ještě nějaký čas zbývá, a je tak relativně velký prostor tuhle chytrou věcičku ještě vyladit… Ano, správně, ne vytvořit, ale skutečně jen vyladit. Ona technologie je totiž už nějakou dobu mezi námi a rádi ji používáme, byť třeba zatím převážně v psané podobě. (Mimochodem – věděli jste, že Google Translate existuje teprve necelých 16 let?) Jen místo univerzálního překladače hovoříme o „machine translation“, zkráceně MT, tedy strojovém či automatickém překladu. Ač tolik vysmívaný, většině z nás už Google Translate nebo některý z jeho bratříčků pomohl zjistit význam cizojazyčného nápisu nebo několika slov v řeči, kterou neovládáme, popř. si alespoň orientačně přeložit dopis od přátel, zprávu z webu nebo třeba recept. A tak asi není divu, že po nedávném razantním nástupu stroje DeepL už má řada lidí pocit, že možná brzy svěříme umělé inteligenci překladatelský obor jako takový a budeme jen tak lehce upravovat, co z ní vyleze.

Je tomu opravdu tak? Zařadí se překladatelé co nevidět do front na úřadech práce? Nebo jde naopak o příležitost, jak posunout celý překladatelský průmysl kupředu?

Na čem závisí kvalita a použitelnost strojového překladu?

 

Mezi lidmi, kteří mají z nějakého důvodu co do činění s překlady, se dají vypozorovat dvě poměrně vyhraněné skupiny. Na první pohled by se mohlo zdát, že půjde na jedné straně o klienty a na druhé straně o překladatele, ale to by bylo dost zavádějící a v řadě případů úplně vedle.

Skupina 1: Viděli jsme pár ukázek a ten pokrok je ohromující! Odteď už budeme používat jen strojový překlad a kolega/sekretářka/asistent, prostě kdokoli, kdo je zrovna po ruce, to zkontroluje a trochu učeše.

Skupina 2: Viděli jsme pár ukázek a dělá to naprosto absurdní a komické chyby. Zachovejme klid, tohle se nemůže nikdy ujmout, lidský mozek je nezastupitelný.

Kdo má pravdu? Nabízí se univerzální odpověď, že pravda je někde mezi… Spíš by ale bylo přesnější říct, že ač obě skupiny původně vyrazily po správné stopě, cestou zabloudily.

Pojďme si zkusit shrnout, na čem použitelnost MT skutečně závisí.

1. Typ a kvalita stroje

Stejně jako v jakémkoli jiném oboru, i v tom překladatelském mají různé produkty rozličnou kvalitu a hodí se na různé věci. Obecné texty přeloží lépe tzv. generické stroje (generic MT), které se učí na velkém objemu různých textů. Naopak pro specializované texty a jednotlivé obory (farmacie, právo, stavebnictví atd.) je lepší „vytrénovat“ tzv. specifický překladač (custom MT). Některé pak obecně fungují líp, některé hůř, ale vlastní kvalitu jednotlivých programů a jejich algoritmů není snadné vzájemně porovnat, protože výsledky velmi závisí na dalším „tréninku“ i konkrétním použití (viz níže).

2. Jazyková kombinace

Tady se zastavme jen velmi krátce, protože toto kritérium nejspíš s dalším vývojem strojového překladu ztratí na významu. Zatím ale obvykle platí, že čím větší a rozšířenější jazyk, tím lepší výsledky. Nezáleží překvapivě ani tak na stavbě a struktuře samotného jazyka, jako spíš na množství a kvalitě učebního materiálu a na prostředcích a energii věnovaných vývoji tzv. enginů, tedy konkrétních překladačů, které jsou určeny pro jednotlivé jazykové kombinace, případně obory.

 3. Typ zdrojového textu

Co je naopak velmi důležité, je typ textu. Zatímco (slušně stylisticky formulovanou) běžnou korespondenci zvládají generické stroje už teď skoro bezvadně, jinde zatím stále tápou. Technické manuály jsou pro MT často snadné sousto, především pokud se člověk spokojí s informativním překladem. Naopak se sofistikovanějšími odbornými texty (právo, lékařství, IT) už většinou dost zápolí a snadno se propadnou do málo použitelného podprůměru.

Samostatnou, často zmiňovanou, kapitolou jsou pak marketingové, žurnalistické, nebo dokonce umělecké texty, kde se kvalita výstupů generických strojů stále skokově zlepšuje. Překlad má většinou dobrou informativní hodnotu, nicméně náročným kritériím nevyhoví a takto přeložený text nejde ani dost dobře „dotáhnout“. Ale k tomu se ještě vrátíme.

4. Kvalita zdrojového textu

Prozatím naprosto zásadní kritérium pro úspěch stroje. Zkuste si nechat přeložit třeba pomocí DeepL text, který je špatně formulovaný, obsahuje dlouhá kostrbatá souvětí, místy naopak krátká hesla, několik neobvyklých zkratek, vyšinutí z vazby, sem tam pár překlepů a různá zvýraznění (velká písmena, tučné, kurziva…) – a uvidíte sami.

5. Účel překladu a očekávaný výsledek

Máte splněna předchozí kritéria a nezáleží vám nijak zvlášť na výsledku, ať už jde o body za stylistiku, nebo o technickou kvalitu (terminologická jednotnost, spolehlivost, co nejmenší počet faktických chyb)? Neváhejte a svěřte podstatnou část práce strojovému překladači – čím kvalitněji bude navržen, „vytrénován“ a – pokud možno – i vyladěn pro vaše potřeby, tím líp. Ušetříte čas i peníze.

Jestli ne, čtěte dál…

 

Co chybí strojovým překladačům, aby byly schopny produkovat skutečně kvalitní texty?

 

Z výše uvedeného vyplývá, že v určitém smyslu, nebo chcete-li, v určitém nemalém segmentu překladatelského trhu, chybí strojovým překladačům k dokonalosti udělat příslovečný poslední krok. Jak je ale dlouhý a jak dlouho na něj budeme čekat?

Strojový překladač zatím nezvládá (přinejmenším ne na výbornou):

1. Konzistentnost terminologie i stylu

Ačkoli i tady se zlepšuje, strojový překlad stále čerpá z obrovské databáze textů, na kterých byl „vytrénován“, a zdaleka ne vždy se mu v celém textu podaří správně trefit a následně udržet jednotnost stylu a terminologie. Dlouho je to dobré, a najednou bác! Ztratil se kontext, čerpalo se z jiné poličky knihovny a do textu se vloudilo něco zjevně cizorodého. Ne že by se tady stroj lišil od chybujícího člověka, jen bychom možná čekali… strojovou přesnost.

2. Občasná hrubá chyba

Tohle na první pohled vypadá ještě zvláštněji, ale i algoritmy mají své díry a vady a občas se něco nepovede. Zvlášť zapeklité bývají několikanásobné zápory, neobvykle použité vsuvky a jiné delikatesy. Čím lepší stroj, tím věrohodněji dokáže na první pohled chyby maskovat. Ale ony tam jsou a vadí. Hodně.

 3. Mezery ve vzdělání

Každý engine se trénuje na souboru dvojjazyčných, a případně i jednojazyčných textů. Čím širší je, tím víc toho překladač umí. Takové soubory jsou ale zpravidla nejednotné a obsahují různé materiály kolísavé kvality, což se projeví i na výsledku překladu. Čím specifičtější a konzistentnější, tím dokonalejší je výsledný překlad. Ovšem jen do chvíle, kdy po stroji začneme chtít něco, co jsme ho jaksi nenaučili. Pak přicházejí zcela komické, absurdní a směšné chyby, výmysly a nesmysly.

4. Stylistika

Tento aspekt nedokonalosti strojového překladu je nejsubjektivnější a nejspornější. Co je už dost dobré a co stylisticky neobstojí? Řekněme si, že z hlediska běžných textů a průměrně talentovaného překladatele se dostaly stroje hodně, opravdu hodně daleko. Ale mají své zjevné limity a jejich stylistické pojetí je takové… strojové. Pamatujete na část „Účel překladu a očekávaný výsledek“?

5. Intuice a improvizace

Tohle stroj prostě zatím nedokáže. Občas mu uteče kontext, občas je význam dovedně či „dovedně“ (ne vždy má autor dar srozumitelného vyjadřování) skrytý za zvláštní formulací v originálu. Někdy je v textu zjevný překlep, který ale omylem či záměrně smění smysl jednotlivých slon. Co? Že je to zjevné? Jak pro koho…

 

Kdo ten poslední krok dokáže udělat, když ne stroj?

 

Přijmeme-li tedy, že strojový překlad už dokáže dojít dost daleko, nabízí se logicky otázka, jak překonat tu poslední etapu do cíle – tedy k dobrému, lépe chvalitebnému, nebo dokonce výbornému překladu. Stroj toho zatím schopen není a možná velmi dlouho nebude. Tenhle magický poslední krok – nebo spíš několik kroků – nebude pro vývojáře vůbec snadné dotáhnout a čím dále se dostanou, tím těžší to bude.

Nezbývá tedy než jej svěřit člověku, ale jakému? Opravdu stačí někdo nekvalifikovaný [čti: levný], jak se řada nadšenců v zájmu úspor nákladů domnívá? Vždyť přece k dokonalosti chybí tak málo! Je to skoro hotové, zbývá to „jen“ zkontrolovat a trochu doladit… Ne, nestačí… Naopak.

Spíš než cílovou rovinku si práci se strojovým překladem přirovnejme ke stavbě domu. V každé jeho fázi je třeba se znalostí věci vybírat stavební materiály, prvky a postupy, které zaručí bezvadný výsledek. Úkol vyladit a opravit strojový překlad (tzv. post-editing) jde ve většině případů přirovnat k situaci, kdy stavař přijde k hotovému domu, který má ale všemožné konstrukční vady – od základů přes zdivo až po střechu. Na žádost o odstranění těch několika „drobných“ vad bude skoro jistě reagovat návrhem dům zbourat a začít znovu.

Podobně i překladatel činí při své práci nespočetná dílčí rozhodnutí (představme si je, pro zjednodušení, na úrovni jednotlivých segmentů textu), která musí zapadat do celkového kontextu a překladatelské strategie pro daný projekt. Z hlediska případného použití strojového překladu tedy nejde o „jeden krok“ (sladění termínů, nalezení a opravení chyb, drobná vylepšení stylu), ale o skutečně komplexní úkol, s nímž nejde jednoduše začít tam, kde stroj skončil. Nebo dobře, jde, ale není to dobrý nápad. Strojový překlad je pro překladatele jen potenciálně velmi užitečným vstupem pro jeho vlastní práci, ne polotovarem, který vezme a dopeče jako mraženou pizzu v troubě. Na příliš mnoha místech se stroj – stejně jako málo schopný či nezkušený překladatel (divili byste se, ale výsledky jejich práce jsou často až k nerozeznání podobné) – vydává slepou uličkou, volí nedobrá překladatelská řešení, používá nevhodné pojmy či konstrukce atd.

 

Historická paralela

 

Jak si aktuální vývoj překladatelského oboru trochu lépe přiblížit a přitom nezabíhat do detailů? Vezměme si třeba historickou automatizaci v průmyslu. Tam, kde bylo k výrobě a sestavení složitého výrobku dříve potřeba dvacet nekvalifikovaných dělníků, jejich předák a specialista konstruktér, budou teď stačit třeba jen tři. Jeden bude programovat a obsluhovat automatizovanou výrobní linku, jeden bude na place kontrolovat a dotahovat velmi složité detaily, které stroj nezvládne, a třetí je bude řídit a kontrolovat.

Podobně zřejmě v brzké budoucnosti ztratí uplatnění armáda nekvalitních překladatelů, jejichž nepřesvědčivé produkty (polotovary) nahradí strojový překlad. O to cennější ale budou na trhu ti skutečně kvalifikovaní, kteří budou umět technologický pokrok využít ke svému prospěchu a také k prospěchu konečného díla.

 

Co z toho všeho vyplývá?

 

Pro klienta:

Dobře si rozmyslete, co vlastně potřebujete. Nechte si případně poradit, třeba i ve formě placené konzultace od odborníků – náklady se vám stokrát vrátí. Pokud se vaše texty hodí pro strojový překlad a nevadí vám všechny neduhy vyjmenované výše, neváhejte ho využívat – proč čekat a platit draze za něco, co můžu mít hned a za pár korun?

Mějte však na paměti, že skutečně kvalitní překlad dostanete vždy jen od skutečně kvalitního překladatele – a je na něm, jak ke kýženému výsledku dojde a zda se rozhodne při práci využít MT.

Rádoby zlatá střední cesta – tedy vzít strojový překlad a požádat kvalifikovaného překladatele, aby ho za zlomek ceny „zkorigoval“ – je slepá ulička. A svěříte-li stejný úkol někomu, kdo potřebnou kvalifikaci postrádá, dopadnete ještě mnohem hůř.

Vždy je třeba se ptát: Vyplatí se mi na překladu ušetřit? A není ušetřená částka ve skutečnosti jen zlomkem nákladů na celý projekt, který můžu nekvalitním překladem ohrozit? Opravdu stojí za to riskovat možný průšvih? Viz pasti strojového překladu (či nekvalitního lidského překladu – stejná věc, stejné problémy) výše. Cena kvalitního překladu odpovídá hodnotě průšvihu, do kterého vás může ten nekvalitní dostat. I v tomto případě se ďábel skrývá v detailech.

 

Pro překladatele:

První – a naprosto logický a zjevný – důsledek rozvoje strojového překladu je důraz na kvalitu práce. Překládáte zřetelně lépe, kvalitněji, spolehlivěji a kreativněji než stroj?

Pokud zní odpověď (a buďte sebekritičtí!) na zmíněnou otázku „ne“, či případně jen váhavě „ano“, pak asi velkou budoucnost v oboru nečekejte. Stejně jako dělníci za průmyslové revoluce rozbíjeli stroje, mohou i dnes překladatelé hartusit, nadávat a kritizovat nástup umělé inteligence, ale to je tak všechno, co s tím mohou dělat.

Jestli je odpověď rozhodné „ano“, tak se není čeho bát, své místo si určitě v moderním světě najdete. To ale neznamená, že je dobrý nápad zůstat stát na místě a nepřizpůsobit se novým možnostem. Stejně jako přešli překladatelé z psacích strojů na počítače, z tiskárny na e-mail a z Wordu na CAT (softwarové překladatelské prostředí), tak je dnes hlavním tématem právě využívání strojového překladu.

 

Jak tedy na to? Pár tipů:

  • Osvojte si dokonale práci s CAT softwarem a do něj si integrujte různé zdroje, včetně strojového překladu.
  • Naučte se rozlišovat různé poskytovatele a enginy MT a vybírejte vždy ty nejvhodnější dle typu textu a účelu překladu.
  • Zkuste co nejvíc využívat to, co je užitečné, a ztrácet co nejméně času a energie na tom, co vám nepomůže. Dobré pasáže použijte, i pokud by jiná část byla směšně nesprávně. Vyhoďte hned, co není k potřebě – myšleno samozřejmě na úrovni jednotlivých segmentů k překladu, ne celého textu.
  • Pracujte na schopnostech a kompetencích, které dřív možná nevypadaly tak důležitě. Psaní všemi deseti a dokonalé ovládání techniky je jen začátek. S více zdroji a vstupy budete méně psát, ale o to více číst, analyzovat a upravovat. Čtete rychle a pozorně?
  • Uvědomte si, že rychlost dodání začne být i u velmi náročných překladů důležitou konkurenční výhodou a možná i nutností.
  • A v neposlední řadě, dodávejte klientovi vždy hotový produkt, který nemusí sám upravovat a dodělávat… V opačném případě bude mít totiž po ruce jednoduché a levné náhradní řešení.

 

Závěrem:

 

Strojový překlad je sice dobrý sluha, ale zatím nic víc.

 

Pozn.: naše překladatelská kancelář Orange Tree využívá dlouhodobě pro odborné překlady softwarové nástroje (autor už více než 20 let), se strojovým překladem pracujeme aktivně již několik let. Vše, co je v článku uvedeno, vychází z našich zkušeností při každodenní práci s různými typy textů.

S laskavým přispěním mých kolegyň Lucie Melicharové, Barbory Vodičkové a Markéty Štulíkové.