Vědci z Fakulty aplikovaných věd jsou již 30 let součástí AI řečové a NLP komunity

Konference Univerzita Věda

Zástupci výzkumných týmů z katedry kybernetiky a katedry výpočetní techniky reprezentovali Západočeskou univerzitu na odborném setkání v Brně.

Zástupci Fakulty aplikovaných věd (FAV) se zúčastnili v pořadí druhého Setkání české komunity automatického zpracování řeči a přirozeného jazyka - NLP (Natural language processing). Akce, již organizovalo Vysoké učení technické v Brně (VUT) a která přilákala více než stovku odborníků, se konala 12. října v brněnském kulturním domě Semilasso.

Přítomni byli zástupci české komunity vědců, výzkumníků a vývojářů v oblasti řečových technologií a zpracování přirozeného jazyka (NLP). Mezi známé osobnosti z této komunity s vazbou na Česko patří Frederick Jelinek (1932-2010), Hynek Heřmanský, Jan Hajič, Jan Černocký, Tomáš Mikolov nebo bývalý vedoucí katedry kybernetiky FAV Josef Psutka. Komunita je široce rozprostřena mezi česká univerzitní pracoviště, komerční firmy i mezinárodní týmy. Zmiňme Univerzitu Karlovu v Praze, České vysoké učení technické, Masarykovu univerzitu, Technickou univerzitu Liberec a v neposlední řadě i FAV.

Řečové technologie a NLP patří mezi základní technologie umělé inteligence. Naši fakultu reprezentovali zástupci výzkumných týmů z již zmíněné katedry kybernetiky a také katedry informatiky a výpočetní techniky.

Pavel Král a Ladislav Lenc z katedry informatiky a výpočetní techniky představili celkem tři projekty. K těm nejnovějším patří projekt na vývoj softwaru, který se momentálně testuje v pilotním provozu, tzv. inteligentního asistenta, jenž by lékařům v budoucnu mohl značně usnadnit práci. Inteligentní asistent pomáhá uživateli (lékaři a dalším osobám zodpovědným za kódování diagnóz, výkonů, léčiv a materiálu pro potřeby vyúčtování péče) s výběrem vhodných dat pro předání zdravotní pojišťovně za účelem efektivního vykazování a vyúčtování zdravotní péče. 

Z již dříve ukončených projektů byl představen projekt na vývoj technologie a softwarového nástroje pro zpracování a souvislé zobrazení katastrálních map z let 1826–1843, na němž se kromě odborníků z katedry informatiky a výpočetní techniky podíleli i kolegové z katedry geomatiky. 

Úspěšný projekt Moderní zpřístupnění historických pramenů umožňuje široké veřejnosti vyhledávat na webu Porta fontium v matrikách, kronikách, listinách, úředních knihách, periodikách a také na historických mapách a plánech až do roku 1918. Portál umožňuje pokročilé dvojjazyčné vyhledávání, a to i na základě lokalizačních údajů.

Až do konce roku 2023 běží projekt AIM LAW. Jeho cílem je automatické zpracování smluvních podmínek na internetu a detekce skryté reklamy. Jedním z řešitelů je kromě zástupců Akademie věd ČR a Univerzity Karlovy také Miloslav Konopík z katedry informatiky a výpočetní techniky FAV, který zde projekt prezentoval.

Katedra kybernetiky představila tři projekty. Asi nejvíce napříč českou společností zarezonoval projekt Gott navždy, na němž pracoval tým výzkumníků pod vedením Jindřicha Matouška. Ti dokázali s využitím umělé inteligence vytvořit věrnou kopii hlasu Karla Gotta. Díky tomu mohli posluchači Českého rozhlasu poslouchat vybrané kapitoly z Gottovy autobiografie Má cesta za štěstím v podání nezaměnitelného hlasu českého zpěváka. Projekt Gott navždy se stal hitem letních prázdnin. Zaznamenal přes jeden milion on demand poslechů a stal se nejposlouchanějším literárně-dramatickým dílem v historii Českého rozhlasu. 

Jan Švec a Luboš Šmídl představili dva projekty, jedním z nich byla digitalizace archivů dokumentů NKVD/KGB k československé historii. Projekt byl realizován ve spolupráci s Ústavem pro studium totalitních režimů. Cílem projektu Digitální archiv dokumentů NKVD/KGB vztahujících se k Československu bylo vytvořit archiv spisů sovětských bezpečnostních složek, který bude nejen přístupný online, ale zároveň bude možné v tisících spisů jednoduše a efektivně vyhledávat. Spisy obsahují nejen úřední záznamy, ale i výslechové protokoly, rozsudky doplněné o důkazní materiály, jako jsou osobní fotografie nebo dopisy zabavené při vyšetřování.

S historií souvisí i poslední představený projekt. Jedná se o vývoj nové technologie strojového učení Asking Quetions pro vyhledávání v audiovizuálních archivech. “Tato technologie umožňuje procházet dlouhé sekvence videozáznamů výpovědí svědků holocaustu, a to na základě předem vygenerovaných otázek s časovým určením. Díky tomu mohou uživatelé přistupovat přímo ke částem svědectví.“ říká Jan Švec. Vědci, kteří jsou součástí českého uzlu evropské výzkumné infrastruktury CLARIN, svou aplikaci představili letos v květnu na Londýnské King’s College v rámci workshopu EHRI-CLARIN, zaměřeném na lepší využitelnost ústních svědectví o holokaustu pro oblast vědy a výzkumu.

Převážně neformální setkání bylo doplněné zvanou přednáškou Bhuvany Ramabhadran ze společnosti Google o technologii pro multilinguální rozpoznávání řeči a přednáškou Ondřeje Ferduse z Platformy pro AI při Svazu průmyslu a dopravy ČR o současném stavu legislativy a regulací AI. Setkání bylo naplněno networkingem, konzultací probíhajících projektů a probrány byly i možnosti přípravy projektů nových, a to jak z národního, tak i mezinárodního pohledu.

Galerie


Odborníci z FAV. Zleva stojící Jindřich Matoušek, Luboš Šmídl, Miloslav Konopík, Aleš Pražák, Jan Švec, Ladislav Lenc a v popředí Pavel Král.

Fakulta aplikovaných věd

Martina Batková

01. 11. 2023