The project aims at speech recognition in situations, where little training data and limited or no knowledge of liguistic and phonetics of the target language are available. In the domain of acoustic models, we will investigate modern techniques of GMM/HMM parameter representations in sub-spaces. The project will also focus on unsupervised creation of pronunciation dictionaries where sequences of phonemes will be replaced by graphemes or clusters of acoustic unites trained on data. Important parts of the project are tests on standard data and participation in international evaluations. (en)
Projekt je zaměřen na rozpoznávání řeči v situacích, kdy je k dispozici málo trénovacích dat a omezené nebo žádné znalosti z lingvistiky a fonetiky cílového jazyka. V oblasti akustických modelů bude zkoumat moderní techniky representace parametrů GMM/HMM modelů v pod-prostorech. Zaměří se také na automatickou tvorbu výslovnostních slovníků náhradou sekvencí fonémů za sekvence znaků nebo shluků akustických jednotek natrénovaných na datech. Nedílnou součástí projektu je ověřování na standardních datech a účast v mezinárodních konferencích.
Řešitel dosáhl nových výsledků v oblasti rozpoznávání řeči s omezenými trénovacími multilingválními daty. Závěrečná karta projektu je adekvátní. Výsledky byly aplikovány např. pro výuku správných výslovností, přepis řeči a vyhledávání klíčových slov. Výstupy byly prezentovány na mezinárodních konferencích s hodnocením CORE A až CORE C, a lokálních workshopech. Formální nedostatky nebyly shledány. (cs)
The project resulted in a sequence of new results in the field of speech recognition with limited training data. The final project resume is adequate. The results were applied in automatic subtitling, search in translation dictionaries, keyword detection and data indexing. The outcomes were presented at international conferences CORE A to CORE C and workshops. No formal issues were found. (en)