„Vytváříme spolu kompetitivní a inkluzivní Evropu“

Projekt NORDTRANS

Hlavním cílem projektu je zvýšit kvalitu a využitelnost technologie automatického přepisu řeči (ASR) pro norštinu, švédštinu a dánštinu. Na rozdíl od existujících řešení bude nově vyvinutá technologie fungovat s vysokou přesností a bude aplikovatelná v oblastech online monitoringu televizního, rozhlasového a internetového vysílání, přepisů jednání v parlamentu (a podobných veřejných institucích), vyhledávání v audio archivech, apod. Zahrnutí vyvinuté technologie do existujících řešení NEWTON Technologies pro multijazykové zpracování řeči otevře nové obchodní příležitosti a možnosti spolupráce v Severní Evropě a také umožní lidem žijícím v této jazykové oblasti využívat nové či vylepšené služby.

Trvání projektu: 1. 1. 2021 – 30. 4. 2024

Partnerské organizace

Poskytovatelé projektu

Projekt „NORDTRANS – Technologie pro automatický přepis řeči ve vybraných severských jazycích“ získal grant
ve výši 1 244 000 € od Norských fondů a Technologické agentury České republiky.

Aktuality

Závěrečná konference k projektu
Závěrečná tisková konference k projektu NORDTRANS

Datum: 14. 3. 2024

Ve čtvrtek 14. března 2024 proběhlo představení významného inovačního pokroku v oblasti řečových technologií, za kterým stojí tým českých a norských odborníků. Výsledky společného projektu byly prezentovány na tiskové konferenci, která se uskutečnila v norském Trondheimu s přenosem online. Představila úspěšné završení mezinárodního partnerství mezi pražskou společností NEWTON TechnologiesTechnickou univerzitou v Liberci (TUL) a Norskou univerzitou vědy a techniky v Trondheimu (NTNU).

Projekt „NORDTRANS – Technologie pro automatický přepis řeči ve vybraných severských jazycích“ byl také financován z grantu ve výši 1 244 000 EUR od Norska a Technologické agentury ČR.

V rámci hlavního výstupu projektu tento mezinárodní tým společně stál za vývojem nejmodernější technologie pro přepis řeči do textu v norštiněšvédštině dánštině. Dle finálního testování překonaly moduly z projektu NORDTRANS světovou konkurenci v přesnosti přepisu ve všech třech severských jazycích.

V průměru naše modely výrazně předčí konkurenci; o několik procentních bodů v dánštině a švédštině, zatímco v norštině je rozdíl v průměrných výsledcích menší, ale stále významný,“ vysvětluje Petr Červa, vedoucí týmu TUL.

Tyto špičkové jazykové moduly s vysokou přesností integrovala společnost NEWTON Technologies do své platformy Beey. Tento online nástroj umožňuje uživatelům po celém světě snadný přístup k nejnovějším technologiím pro různá využití, od titulkování videízápisů z jednání a přepisů konferencí až po automatické shrnutí a další zpracování pomocí umělé inteligence.

Takzvané velké jazykové modely (LLM), o kterých se momentálně všude mluví, jsou založeny především na psané formě jazyků. Většina digitálního obsahu je však ve zvukovém nebo audiovizuálním formátu: až dvě třetiny veškerého provozu na internetu tvoří videa. Když řeč z audiovizuálních zdrojů převedete do psaného textu, můžete výkon umělé inteligence využít i na tento obsah,“ dodává Alessandro Cederle ze společnosti NEWTON Technologies k dopadu technologie převodu řeči na text na současnou vlnu AI v digitálním světě.

Více informací v angličtině můžete najít na odkazu níže.

Zjistit více

 

Tisková konference k projektu
Tisková konference k projektu NORDTRANS

Datum: 24. 11. 2022

NEWTON Technologies představilo projekt NORDTRANS a vývoj řečových technologií pro severské jazyky na tiskové konferenci s ukázkou uplatnění v aplikaci Beey.

Setkání proběhlo dne 24.11. 2022 v prostorech NEWTON Technologies v Praze. Za pořadatele prezentovala Lenka Weingartová, hlavní řešitelka projektu. Dále své výzkumné aktivity představili Petr Červa a Jan Nouza z Technické univerzity v Liberci, a především hosté z NTNU – Janine Rugayan a Torbjørn Svendsen. Celá prezentace probíhala v angličtině a její záznam je dostupný zde.

Zjistit více

Prezentace projektu NORDTRANS
Projekt NORDTRANS jako příklad dobré praxe

Datum: 20. 9. 2022

Dne 20.9. se společnost NEWTON Technologies účastnila setkání k průběhu implementace Fondů EHP a Norska. Lenka Weingartová prezentovala projekt NORDTRANS, ve kterém spolu s Technickou univerzitou v Liberci připravuje technologii pro automatický přepis řeči na text pro norštinu (a výhledově i švédštinu).

Jsme hrdí, že byl projekt vybrán z dvaceti dalších z kategorie Výzkum k prezentaci rozpoznávače norštiny jako příklad dobré praxe použití Norských fondů. Navíc nás potěšilo, že se setkání účastnil také velvyslanec Norského království a další zástupci Norské ambasády v Praze a mohli si prohlédnout živou ukázku přepisu norštiny v aplikaci Beey.

Vyzkoušejte si Beey také

Identifikace skandinávských jazyků na TSD
Identifikace skandinávských jazyků na konferenci Text, Speech and Dialogue 2021

Datum: 10. 9. 2021

Tým Petra Červy a Jana Nouzy prezentoval na záříjové konferenci Text, Speech and Dialogue v Olomouci článek s názvem „Identification of Scandinavian Languages from Speech Using Bottleneck Features and X-vectors„.
Článek se zabývá identifikací tří hlavních skandinávských jazyků (švédštiny, dánštiny a norštiny) z mluvených dat a identifikuje jako nejlepší přístupy ty, které využívají vícejazyčné tzv. bottleneck features (BTN). Ty umožňují identifikovat cílové jazyky v segmentech řeči trvajících pouhých 5 sekund s velmi nízkou chybovostí, kolem 1 %. Identifikace má mnoho praktických aplikací, například v systémech pro přepis skandinávských televizních a rozhlasových pořadů, kde se mohou vyskytovat osoby hovořící všemi cílovými jazyky.

Norština nyní dostupná v Beey
Norština nyní dostupná v Beey

Datum: 11. 8. 2021

První verze automatického přepisu norštiny je nyní dostupná v aplikaci Beey. Beey je webová platforma určená pro automatický přepis nahrávek a jeho rychlou editaci.
Norština se tak stává prvním komerčně dostupným severským jazykem v portfoliu NEWTON Technologies.

Akustický model je natrénován na 210 hodinách nahrávek sesbíraných z různých veřejně dostupných zdrojů, například norské televizní stanice NRK, norského rozhlasu a přepisů parlamentních jednání.

Automatický přepis norštiny si poradí s oběma psanými variantami, bokmål i nynorsk, a to i v případě, že mluvčí mezi oběma variantami přecházejí.

Vyzkoušejte Beey teď hned

Rozhovor v rámci fóra Meltingpot
Rozhovor s Lenkou Weingartovou v rámci fóra Meltingpot

Datum: 28. 5. 2021

Hlavní řešitelka projektu NordTrans, lingvistka Lenka Weingartová, byla hostem fóra Meltingpot. V rozhovoru s moderátorem Vladimírem Piskalou mluvili o tom, jak naučit počítač rozumět lidské řeči, a o projektech, na kterých se NEWTON Technologies v současné době podílí, včetně projektu NordTrans a úskalí rozpoznávání skandinávských jazyků.

Kontaktní informace

Lenka Weingartová, Ph.D.
hlavní řešitel, NEWTON Technologies
[email protected]

Petr Červa, Ph.D.
vedoucí týmu, TUL
[email protected]

Prof. Giampiero Salvi, PhD
vedoucí týmu, NTNU
[email protected]