O překladačích

Vývoji jazykového softwaru i dat se věnujeme více než 20 let. Za tu dobu jsme nasbírali spoustu zkušeností a vytvořili řadu nástrojů, technologií a aplikací, jako jsou slovníky a překladače. Na jejich vývoji pokračujeme i nadále, překladače zlepšujeme ve spolupráci se špičkovými univerzitními pracovišti. Chceme-li dosáhnout skutečně dokonalého překladu, pak už nelze vystačit jen se slovníkem a morfologií.

Obecně je potřeba vyřešit základní problémy:

  1. Výběr správného významu, což se týká všech vícevýznamových slov.
  2. Pořadí slov ve větě.
  3. Použití správných tvarů slov cílového jazyka.
  4. Idiomatičnost a další atypičnosti jednotlivých jazyků.

Informativní překlad se zabývá překladem celých vět a článků z jednoho jazyka do druhého. Překlad sice není a ještě nějakou dobu nějaký čas nebude dokonalý, umožňuje však čtenáři v obecné rovině pochopit, o čem se v daném článku nebo na webové stránce píše.

himl logo

Překladač se dá natrénovat na určitou terminologii. Příkladem může být výsledek spolupráce s University of Edinburgh nebo MFF UK v Praze na mezinárodní projektu Health In My Language. Pro tento účel byla vyvinuta verze překladače, která byla natrénovaná pro překlad textů v oblasti farmacie.

Druhy překladačů

       

První překladače
Některé překladače používají dnes již zastaralou technologii jednoduchého překladu po slovech či krátkých slovních spojeních, tento přístup byl typický pro první pokusy se strojovým překladem na konci minulého století.

Frázové překladače

Zde se používá přístup založený na velkých korpusech paralelních i jednojazyčných dat, ze kterých se vytvářejí statistické překladové a jazykové modely umožňující z mnoha různých možností podle kontextu zvolit s jistou pravděpodobností tu nejvhodnější variantu.

Zjednodušeně řečeno frázový překladač využívá překladů celých slovních a víceslovných celků, ze kterých dle statistické pravděpodobnosti skládá výsledné překladové věty. Tyto výsledné překlady sice nejsou většinou zdaleka gramaticky a stylově dokonalé, ale pomohou získat překlad, který obsahově dobře odpovídá výchozímu textu. Výsledná věta sice na první pohled nevypadá „učesaně“, ale uživatel získá alespoň dobrou představu o obsahu výchozí věty. Frázový překladač tak obvykle správně přeloží pouze ty obraty a ustálená spojení, která jsou dosti častá a standardně překládaná v textech, které již odněkud doslovně „zná“. Může mít proto problém s překladem vícevýznamových slov užitých ve specifickém kontextu, kde je pro výběr správného významu třeba již využít jisté inteligence.

Frázový překladač Lingea můžete vyzkoušet na https://www.slovnicek.cz/.

Neuronové překladače

Firma Google spustila první neuronové překladače v roce 2017. My se těmito postupy zabýváme také už řadu let, od roku 2017 také v rámci projektu zaměřeného na vysoce kvalitní překladače mezi slovanskými jazyky, který finančně podpořilo i Ministerstvo průmyslu a obchodu v rámci grantové výzvy ICT a sdílené služby.

Neuronový překladač využívá umělé inteligence a je schopen se „učit“ z velkých objemů cizojazyčných i paralelních (dvojjazyčných) překladových textů a osvojovat si nejen běžnou slovní zásobu, ale velice dobře také obecné principy fungování daného jazyka. Překladač potom vytváří od základu celé překladové věty opravdu jen na základě „znalostí“, které si vytvoří během učení a trénování na specifických textech. Takto vytvořené výsledné překladové věty se již velmi často svojí stavbou, slovosledem i volbou slov blíží větám vytvořeným člověkem. Základním nedostatkem neuronového překladače je momentálně jeho poněkud omezená slovní zásoba a terminologická „nepředvídatelnost“. V případě překladu okrajovějších termínů nebo idiomů může chovat poměrně nevyzpytatelně a nelze se na faktickou správnost překladu zcela spolehnout, ačkoli výsledná věta vypadá na první pohled gramaticky velmi dobře.Momentálně se tedy jako optimální řešení pro dosažení relativně rychlého a současně spolehlivého strojového překladu jeví souběžné užívání neuronového a frázového překladače v kombinaci s kvalitním, rozsáhlým a aktuálním slovníkem umožňujícím fulltextové vyhledávání.


Náš neuronový překladač Lingea Translator můžete vyzkoušet na https://prekladac.lingea.cz/