Aplikace Beey, která vznikla ve spolupráci s Technickou univerzitou v Liberci, automaticky rozpoznává řeč a umožňuje okamžitou editaci přepsaného textu. Aby byl přepis co nejkvalitnější a editace co nejrychlejší, slovník rozpoznávače se aktualizuje každý den, a to na základě nejnovějších zpráv z médií.

Slova přidaná do slovníku nejčastěji sestávají z vlastních jmen (Trzaskowski, Engström) a aktuálních pojmů (polomasky, bezpříznakový), které se během předchozího dne nově vyskytly v médiích. Díky tomuto inovativnímu řešení můžeme našemu editorskému týmu poskytnout nejlepší možnou kvalitu přepisu a ulehčit jim tak práci s editací.

Z naší analýzy 1140 nově přidaných slov za rok 2019 vyplývá, že v 63 % případů se jedná o jména osob, o kterých se v médiích aktuálně mluví. Z toho největší podíl patří do podkategorie SPORT (39 %), která zahrnuje osobnosti ze světa fotbalu (93 jmen), tenisu (53 jmen), cyklistiky (36), hokeje (33), atletiky (16), basketbalu (15) a řady dalších sportů (35 jmen).

Tento výsledek přímo naznačuje, o které sporty je v českých médiích největší zájem. Dá se ale také předpokládat, že vzhledem ke své sezónní povaze se sporty zastoupeny v této podkategorii v průběhu roku mění.

Kategorie nově přidaných vlastních jmen v roce 2019

Zastoupení jmen v podkategoriích POLITIKA (24 %) a KŘESTNÍ JMÉNA (12 %) se odvíjí od aktuálních kauz a událostí pokrytých v médiích. V roce 2019 byla například přidána jména spjatá s prezidentskými volbami na Slovensku, tedy jméno současné slovenské prezidentky, Zuzany Čaputové, a jméno slovenského eurokomisaře Maroše Šefčoviče.

Podkategorie OSTATNÍ (6 %) obsahuje mimo jiné i jména, u nichž není jasné, která z osob s daným jménem byla impulzem pro přidání nového slova. Toto byl případ anglického příjmení Bolton. Jak politik John Bolton, tak i fotbalista Clint Bolton byli zastoupeni v médiích, ale z analýzy není jasné, které výskyty lze přiřadit ke které osobě.

Z analýzy také vyplynulo, že většina přidaných slov (76 %) přirozeně pochází z cizích jazyků, zatímco českých slov, které by byly pro přepisovač novinkou, je o poznání méně.

Původ nově přidaných slov v roce 2019

Kromě každodenní aktualizace slovní zásoby nabízí rozpoznávač Beey také možnost přidat slova do tzv. uživatelského slovníku. Každý uživatel si může přímo v aplikaci přidat slova, která Beey zatím nezná. Nejčastěji se jedná o odborné termíny či jména, která se užívají v rámci konkrétní instituce, organizace, konkrétního článku nebo projektu. Není tedy pravděpodobné, že se tato slova dostanou do médií, odkud získáváme kandidáty na každodenní update slovníku. Pro jednotlivé uživatele však funkce přidání vlastních termínů přijde vhod.

 

Autoři článku: Veronika Volná, Eliška Kubánková