Hlavním cílem projektu je zvýšit kvalitu a využitelnost technologie automatického přepisu řeči (ASR) pro norštinu a švédštinu. Na rozdíl od existujících řešení bude nově vyvinutá technologie fungovat s vysokou přeností a bude aplikovatelná v oblastech online monitoringu televizního, rozhlasového a internetového vysílání, přepisů jednání v parlamentu (a podobných veřejných institucích), vyhledávání v audio archivech, apod. Zahrnutí vyvinuté technologie do existujících řešení NEWTON Technologies pro multijazykové zpracování řeči otevře nové obchodní příležitosti a možnosti spolupráce v Severní Evropě a také umožní lidem žijícím v této jazykové oblasti využívat nové či vylepšené služby.
Projekt „NORDTRANS – Technologie pro automatický přepis řeči ve vybraných severských jazycích“ získal grant ve výši 1 244 000 € od Norských fondů a Technologické agentury České republiky.
Aktuality
Tisková konference k projektu
Prezentace projektu NORDTRANS
Identifikace skandinávských jazyků na TSD
Norština nyní dostupná v Beey
Rozhovor v rámci fóra Meltingpot
Tisková konference k projektu
Tisková konference k projektu NORDTRANS
Datum: 24. 11. 2022
NEWTON Technologies představilo projekt NORDTRANS a vývoj řečových technologií pro severské jazyky na tiskové konferenci s ukázkou uplatnění v aplikaci Beey.
Setkání proběhlo dne 24.11. 2022 v prostorech NEWTON Technologies v Praze. Za pořadatele prezentovala Lenka Weingartová, hlavní řešitelka projektu. Dále své výzkumné aktivity představili Petr Červa a Jan Nouza z Technické univerzity v Liberci, a především hosté z NTNU – Janine Rugayan a Torbjørn Svendsen. Celá prezentace probíhala v angličtině a její záznam je dostupný zde.
Dne 20.9. se společnost NEWTON Technologies účastnila setkání k průběhu implementace Fondů EHP a Norska. Lenka Weingartová prezentovala projekt NORDTRANS, ve kterém spolu s Technickou univerzitou v Liberci připravuje technologii pro automatický přepis řeči na text pro norštinu (a výhledově i švédštinu).
Jsme hrdí, že byl projekt vybrán z dvaceti dalších z kategorie Výzkum k prezentaci rozpoznávače norštiny jako příklad dobré praxe použití Norských fondů. Navíc nás potěšilo, že se setkání účastnil také velvyslanec Norského království a další zástupci Norské ambasády v Praze a mohli si prohlédnout živou ukázku přepisu norštiny v aplikaci Beey.
Identifikace skandinávských jazyků na konferenci Text, Speech and Dialogue 2021
Datum: 10. 9. 2021
Tým Petra Červy a Jana Nouzy prezentoval na záříjové konferenci Text, Speech and Dialogue v Olomouci článek s názvem „Identification of Scandinavian Languages from Speech Using Bottleneck Features and X-vectors„. Článek se zabývá identifikací tří hlavních skandinávských jazyků (švédštiny, dánštiny a norštiny) z mluvených dat a identifikuje jako nejlepší přístupy ty, které využívají vícejazyčné tzv. bottleneck features (BTN). Ty umožňují identifikovat cílové jazyky v segmentech řeči trvajících pouhých 5 sekund s velmi nízkou chybovostí, kolem 1 %. Identifikace má mnoho praktických aplikací, například v systémech pro přepis skandinávských televizních a rozhlasových pořadů, kde se mohou vyskytovat osoby hovořící všemi cílovými jazyky.
Norština nyní dostupná v Beey
Norština nyní dostupná v Beey
Datum: 11. 8. 2021
První verze automatického přepisu norštiny je nyní dostupná v aplikaci Beey. Beey je webová platforma určená pro automatický přepis nahrávek a jeho rychlou editaci. Norština se tak stává prvním komerčně dostupným severským jazykem v portfoliu NEWTON Technologies.
Akustický model je natrénován na 210 hodinách nahrávek sesbíraných z různých veřejně dostupných zdrojů, například norské televizní stanice NRK, norského rozhlasu a přepisů parlamentních jednání.
Automatický přepis norštiny si poradí s oběma psanými variantami, bokmål i nynorsk, a to i v případě, že mluvčí mezi oběma variantami přecházejí.
Rozhovor s Lenkou Weingartovou v rámci fóra Meltingpot
Datum: 28. 5. 2021
Hlavní řešitelka projektu NordTrans, lingvistka Lenka Weingartová, byla hostem fóra Meltingpot. V rozhovoru s moderátorem Vladimírem Piskalou mluvili o tom, jak naučit počítač rozumět lidské řeči, a o projektech, na kterých se NEWTON Technologies v současné době podílí, včetně projektu NordTrans a úskalí rozpoznávání skandinávských jazyků.