„Vytváříme spolu kompetitivní a inkluzivní Evropu“

Projekt NORDTRANS

Hlavním cílem projektu je zvýšit kvalitu a využitelnost technologie automatického přepisu řeči (ASR) pro norštinu a švédštinu. Na rozdíl od existujících řešení bude nově vyvinutá technologie fungovat s vysokou přeností a bude aplikovatelná v oblastech online monitoringu televizního, rozhlasového a internetového vysílání, přepisů jednání v parlamentu (a podobných veřejných institucích), vyhledávání v audio archivech, apod. Zahrnutí vyvinuté technologie do existujících řešení NEWTON Technologies pro multijazykové zpracování řeči otevře nové obchodní příležitosti a možnosti spolupráce v Severní Evropě a také umožní lidem žijícím v této jazykové oblasti využívat nové či vylepšené služby.

Trvání projektu: 1. 1. 2021 – 30. 4. 2024

Partnerské organizace

Poskytovatelé projektu

Projekt „NORDTRANS – Technologie pro automatický přepis řeči ve vybraných severských jazycích“ získal grant
ve výši 1 244 000 € od Norských fondů a Technologické agentury České republiky.

Aktuality

Identifikace skandinávských jazyků na TSD
Identifikace skandinávských jazyků na konferenci Text, Speech and Dialogue 2021

Datum: 10. 9. 2021

Tým Petra Červy a Jana Nouzy prezentoval na záříjové konferenci Text, Speech and Dialogue v Olomouci článek s názvem „Identification of Scandinavian Languages from Speech Using Bottleneck Features and X-vectors„.
Článek se zabývá identifikací tří hlavních skandinávských jazyků (švédštiny, dánštiny a norštiny) z mluvených dat a identifikuje jako nejlepší přístupy ty, které využívají vícejazyčné tzv. bottleneck features (BTN). Ty umožňují identifikovat cílové jazyky v segmentech řeči trvajících pouhých 5 sekund s velmi nízkou chybovostí, kolem 1 %. Identifikace má mnoho praktických aplikací, například v systémech pro přepis skandinávských televizních a rozhlasových pořadů, kde se mohou vyskytovat osoby hovořící všemi cílovými jazyky.

Norština nyní dostupná v Beey
Norština nyní dostupná v Beey

Datum: 11. 8. 2021

První verze automatického přepisu norštiny je nyní dostupná v aplikaci Beey. Beey je webová platforma určená pro automatický přepis nahrávek a jeho rychlou editaci.
Norština se tak stává prvním komerčně dostupným severským jazykem v portfoliu NEWTON Technologies.

Akustický model je natrénován na 210 hodinách nahrávek sesbíraných z různých veřejně dostupných zdrojů, například norské televizní stanice NRK, norského rozhlasu a přepisů parlamentních jednání.

Automatický přepis norštiny si poradí s oběma psanými variantami, bokmålnynorsk, a to i v případě, že mluvčí mezi oběma variantami přecházejí.

Vyzkoušejte Beey teď hned

Rozhovor v rámci fóra Meltingpot
Rozhovor s Lenkou Weingartovou v rámci fóra Meltingpot

Datum: 28. 5. 2021

Hlavní řešitelka projektu NordTrans, lingvistka Lenka Weingartová, byla hostem fóra Meltingpot. V rozhovoru s moderátorem Vladimírem Piskalou mluvili o tom, jak naučit počítač rozumět lidské řeči, a o projektech, na kterých se NEWTON Technologies v současné době podílí, včetně projektu NordTrans a úskalí rozpoznávání skandinávských jazyků.

Kontaktní informace

Lenka Weingartová, Ph.D.
hlavní řešitel, NEWTON Technologies
lenka.weingartova@newtontech.cz

Petr Červa, Ph.D.
vedoucí týmu, TUL
petr.cerva@tul.cz

Prof. Giampiero Salvi, PhD
vedoucí týmu, NTNU
giampiero.salvi@ntnu.no