Informatici získali US patent na vícezdrojový překlad

28. srpna 2024

Ondřej Bojar a Dominik Macháček z ÚFAL MFF UK získali americký patent pro simultánní strojový překlad řeči z více jazykových zdrojů. Matfyz díky tomu drží výlučné právo ke komerčnímu zhodnocení výsledků svého výzkumu v USA. Autoři v současnosti hledají vhodného aplikačního partnera.

Dominik Macháček (vlevo) a Ondřej Bojar

Patent evidovaný pod číslem US 12,056,457 B2 pokrývá simultánní strojový překlad řeči z více jazykových zdrojů. Jde o už druhou úspěšnou přihlášku autorského kolektivu Ondřeje Bojara ve Spojených státech. První byl patent 2021 Bojar-Sudarikov pro trénování překladového systému pro malé jazyky a specifické domény, např. textové zprávy SMS. 

Strojový překlad je proces, při kterém počítač automaticky překládá text nebo řeč z jednoho jazyka do jiného, např. z angličtiny do češtiny. Tato technologie s výrazným výzkumným i praktickým potenciálem spadá do oblasti počítačové lingvistiky a je zkoumána již od padesátých let minulého století. 

Zajímavým problémem při překladu řeči je simultánnost. Mnohé přednášky, konference nebo schůze je nutné překládat co nejrychleji, pokud možno simultánně, aby posluchači, kteří k porozumění potřebují asistenci, mohli interagovat s řečníkem v reálném čase. Takovou situaci řeší simultánní strojový překlad jednak technologicky co nejrychlejším zpracováním, jednak lingvisticky rozpoznáním, kdy překládat a kdy čekat na další slova, která pomohou zjednoznačnit význam, a tím zlepšit kvalitu překladu. 

Počítačové zpracování řeči a následný překlad v simultánním režimu jsou náročné procesy, ve kterých stroj často chybuje. Ondřej Bojar a Dominik Macháček navrhli originální metodu, jak chyby eliminovat. Mnohá mezinárodní zasedání, např. v Evropském parlamentu, jsou simultánně tlumočena do vícero jazyků. Tím je možné výstupy tlumočení zkombinovat v překladu do vybraného jazyka. Například anglické slovo funded zní podobně jakou founded. Pro počítač je snadné tato slova zaměnit a udělat v překladu třeba do němčiny chybu. Je-li však díky tlumočníkovi k dispozici simultánní překlad do češtiny (financováno vs. založeno), může být nejasnost rozhodnuta správně.

Překladač tedy „neposlouchá“ pouze jednoho řečníka, jak je obvyklé, ale více řečníků najednou. Sledováním více kanálů navíc dostává stroj možnost eliminovat výpadky jednotlivých vstupů, způsobené nekvalitním zvukem, nesrozumitelnou výslovností nebo dalšími vlivy. Patentovaný systém umožňuje plynule přejít na alternativní zdroj, na dalšího z dostupných tlumočníků.

Získání technologického patentu není jednoduché z vědeckých, administrativních i finančních důvodů. Podání patentu pro vícezdrojový překlad řeči vzniklo díky mimořádné souhře okolností. V letech 2019–2022 pracoval řešitelský tým pod vedením Ondřeje Bojara na evropském výzkumném a inovačním projektu ELITR – European Live Translator, v jehož rámci realizoval technologickou stránku řešení. Poměrně nákladnou patentovou ochranu de-facto umožnila covidová pandemie, která změnila plány projektu.

Díky udělení amerického patentu MFF UK drží výlučné právo ke komerčnímu zhodnocení v celosvětově významné oblasti, a to ve Spojených státech amerických. Dalším cílem původců patentu je jeho praktické využití. Hledají proto zákazníky, kteří by ocenili spolehlivější překlad řeči.

ÚFAL, OPMK