Kybernetici pomáhají plzeňským dopravním podnikům testovat software na syntézu hlasu

Spolupráce Univerzita Veřejnost

Z textových podkladů vzniká uměle vytvořený hlas, který zkušebně promlouvá k cestujícím na tramvajové lince č. 4.

Plzeňské městské dopravní podniky (PMDP), katedra kybernetiky Fakulty aplikovaných věd ZČU a společnost SpeechTech, jež na Západočeské univerzita vznikla, testují ve vozech MHD software na syntézu hlasu. 

Cílem spolupráce je, aby software uměl jakoukoliv textovou zprávu přetlumočit uměle vytvořeným hlasem, k nerozeznání podobným hlasu profesionálního řečníka, a promlouvat tak k cestujícím. Potřebný hlas by měl mít nejen správný styl přednesu, ale rovněž by měl být srozumitelný v akustickém prostoru vozu PMDP, což není samozřejmost.

Podle PMDP by automatický převod psaného textu na řeč usnadnil a zrychlil komunikaci s cestujícími. Dopravní podniky toho využily v rámci testování již v době koronavirové pandemie. „Od začátku letošního roku jsme interně prověřovali kvalitu hlášek vytvářených pokročilou technologií syntézy lidské řeči. Díky okolnostem jsme již mohli software otestovat i v reálných podmínkách. V průběhu pandemie nám dodavatel umožnil bezplatné rychlé vytvoření informativních hlášek, které se nám tak k cestujícím povedlo dostat v rekordním čase,“ popisuje Roman Zarzycký, 1. náměstek primátora a předseda představenstva PMDP.

Testování kompletních zvuků včetně názvů zastávek bude probíhat v druhé polovině června v jednom z vozů na tramvajové lince č. 4. „Jedná se o nasazení standardního hlasu TTS, obecně nabízeného společností SpeechTech, nikoliv tedy hlasu speciálně vytvořeného pro PMDP. Novinka spočívá v tom, že syntéza hlasu se používá k vygenerování příslušných hlášení, zejména jmen zastávek, časově velmi náročnou, ale zato vysoce kvalitní metodou generování řeči hlubokými neuronovými sítěmi. Zvukové soubory těchto hlášení jsou pak přehrávány ve voze PMDP jako zvukové soubory,“ popisuje za katedru kybernetiky FAV profesor Luděk Müller.

„Přestože se jedná o offline řešení a hláška z příslušného textu není generována přímo ve voze, může použití syntézy přinést mnohem flexibilnější řešení než poskytuje stávající metoda nahrávání nového hlášení ve studiu profesionálním řečníkem,“ dodává Müller, který v roce 2000 po dohodě se zaměstnanci oddělení umělé inteligence katedry kybernetiky založil společnost SpeechTech. Společnost dnes s katedrou spolupracuje na základě rámcové smlouvy a jejich známým společným projektem je například titulkování živých televizních pořadů.

V případě, že se právě testovaný software osvědčí, budou PMDP uvažovat o jeho využití ve všech vozech městské veřejné dopravy.

Ilustrační foto: PMPD

Fakulta aplikovaných věd

Pavel KORELUS

16. 06. 2020