Skupina
výzkumníků z katedry kybernetiky a výzkumného centra NTIS
uspěla se svojí aplikací umožňující interaktivní prohledávání
videoarchivu v demonstrační sekci (tzv. Show &
Tell) prestižní
mezinárodní konference věnované řečovým technologiím
Interspeech 2016.
Aplikace byla nejprve vybrána v recenzním řízení pro prezentaci a po předvedení v září v San Francisco byla hlasováním účastníků konference vyhodnocena jako nejlepší v konkurenci čtyřiadvaceti demonstračních prototypů z celého světa.
Oceněná aplikace umožňuje rychlé a uživatelsky přívětivé prohledávání rozhovorů s pamětníky holokaustu, uložených v archivu USC Shoah Foundation. Tento archiv obsahuje zhruba 116 tisíc hodin rozhovorů vedených ve 32 jazycích. Aplikace nicméně pracuje zatím „pouze“ se všemi rozhovory vedenými v češtině (cca 1000 hodin) a se stejným objemem anglických nahrávek. Jádrem prezentovaného řešení je systém pro rozpoznávání řeči vyvinutý na katedře kybernetiky, který automaticky převádí zvukovou stopu záznamů do formy vhodné pro uložení do databáze, v níž lze pak velmi rychle vyhledávat libovolná slova či krátké fráze.
Aplikace je výsledkem mnohaleté soustavné práce výzkumného týmu, zdaleka nejen autorů oceněného softwaru, která byla podpořena několika mezinárodními i tuzemskými granty; vlastní vývoj vyhledávacího rozhraní pak zejména projektem Centrum aplikované kybernetiky 3 (TE01020197).
Vyhledávací rozhraní též využívá modul pro oboustranný automatický překlad mezi češtinou a angličtinou, vyvinutý pracovníky Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty UK, který je dlouholetým partnerem katedry kybernetiky ve výzkumných projektech týkajících se komplexního zpracování mluvené i psané řeči.
Fakulta aplikovaných věd |
Pavel Ircing |
29. 09. 2016 |