Kybernetici pomáhají plzeňským dopravním podnikům testovat software na syntézu hlasu

Spolupráce Univerzita Veřejnost

Z textových podkladů vzniká uměle vytvořený hlas, který zkušebně promlouvá k cestujícím na tramvajové lince č. 4.

Plzeňské městské dopravní podniky (PMDP), katedra kybernetiky Fakulty aplikovaných věd ZČU a společnost SpeechTech, jež na Západočeské univerzita vznikla, testují ve vozech MHD software na syntézu hlasu. 

Cílem spolupráce je, aby software uměl jakoukoliv textovou zprávu přetlumočit uměle vytvořeným hlasem, k nerozeznání podobným hlasu profesionálního řečníka, a promlouvat tak k cestujícím. Potřebný hlas by měl mít nejen správný styl přednesu, ale rovněž by měl být srozumitelný v akustickém prostoru vozu PMDP, což není samozřejmost.

Podle PMDP by automatický převod psaného textu na řeč usnadnil a zrychlil komunikaci s cestujícími. Dopravní podniky toho využily v rámci testování již v době koronavirové pandemie. „Od začátku letošního roku jsme interně prověřovali kvalitu hlášek vytvářených pokročilou technologií syntézy lidské řeči. Díky okolnostem jsme již mohli software otestovat i v reálných podmínkách. V průběhu pandemie nám dodavatel umožnil bezplatné rychlé vytvoření informativních hlášek, které se nám tak k cestujícím povedlo dostat v rekordním čase,“ popisuje Roman Zarzycký, 1. náměstek primátora a předseda představenstva PMDP.

Testování kompletních zvuků včetně názvů zastávek bude probíhat v druhé polovině června v jednom z vozů na tramvajové lince č. 4. „Jedná se o nasazení standardního hlasu TTS, obecně nabízeného společností SpeechTech, nikoliv tedy hlasu speciálně vytvořeného pro PMDP. Novinka spočívá v tom, že syntéza hlasu se používá k vygenerování příslušných hlášení, zejména jmen zastávek, časově velmi náročnou, ale zato vysoce kvalitní metodou generování řeči hlubokými neuronovými sítěmi. Zvukové soubory těchto hlášení jsou pak přehrávány ve voze PMDP jako zvukové soubory,“ popisuje za katedru kybernetiky FAV profesor Luděk Müller.

„Přestože se jedná o offline řešení a hláška z příslušného textu není generována přímo ve voze, může použití syntézy přinést mnohem flexibilnější řešení než poskytuje stávající metoda nahrávání nového hlášení ve studiu profesionálním řečníkem,“ dodává Müller, který v roce 2000 po dohodě se zaměstnanci oddělení umělé inteligence katedry kybernetiky založil společnost SpeechTech. Společnost dnes s katedrou spolupracuje na základě rámcové smlouvy a jejich známým společným projektem je například titulkování živých televizních pořadů.

V případě, že se právě testovaný software osvědčí, budou PMDP uvažovat o jeho využití ve všech vozech městské veřejné dopravy.

Ilustrační foto: PMPD

Fakulta aplikovaných věd

Pavel KORELUS

16. 06. 2020


Věřím, že se studenti přizpůsobí větším nárokům a všechno zvládnou, říká prorektorka Blanka Šedivá

covid-19 Etika Studenti

Celouniverzitní

12. 11. 2020

Tématem výtvarné soutěže pro středoškoláky je Začátek a konec

Soutěž Studium Veřejnost

Fakulta designu a umění Ladislava Sutnara

26. 11. 2020

Mezinárodní den studentstva si letos připomeneme bez veřejných akcí

Studenti Univerzita Veřejnost

Celouniverzitní

16. 11. 2020