Huge development in the field of automatic human voice to text transcription together with growing influence of electronic mass media and voice communication devices expansion caused that automatic media monitoring and spoken document retrieval became topics of the day. Speech Laboratory at the Technical University of Liberec has a long tradition in the research of fluent speech to text transcription. Contemporary its activity is concentrated on broadcast programs transcription. Essential part of every state of the art transcription system is speaker change detector. The goal of this project is to develop fully automated segmentator respecting especially speaker changes. It could be shown that commonly used statistical change-point models can't provide segmentation with high enough precision. To improve the segmentator it is planed to combine common approach with an analysis of further informational content of acoustic record, namely appearances of specific acoustic elements. (en)
S výrazným pokrokem v oblasti automatického přepisu lidské řeči, vzrůstajícím vlivem elektronických masmédií a s rozšířením hlasových komunikačních prostředků se stal monitoring médií a prohledávání záznamů obsahujících lidskou řeč jedním z nejožehavějších témat současného výzkumu v oblasti zpracování řeči. Laboratoř počítačového zpracování řeči na TUL má dlouhou tradici ve vývoji technologie automatického přepisu plynulé řeči a nyní se její výzkumná aktivita soustředí na transkripci televizního a rozhlasového zpravodajství. Nezbytným krokem k plně automatizovanému přístupu vytěžování informací z mluvených záznamů je precizní automatická segmentace. Cíl projektu je vyvinout plně automatický segmentátor umožňující segmentovat audio záznam především v místech změny mluvčího. Běžné statistické modely potencionálního bodu změny však nevedou bez dalších přídavných informací k uspokojivé segmentaci, především z hlediska přesnosti lokalizace. Pro segmentátor tedy bude využito kombinace (cs)