In the last years, we have been involved in European projects M4 and AMI. One of the objectives of these projects was development of a browser allowing for easy navigation in recorded meeting, tracing its interesting parts and their playback. It was found that it would be extremely valuable to extend existing browser with functionality of fast interactive keyword detection. The classical keyword spotting methods based only on evaluation of statistical acoustic models are too slow for this purpose. The aim of this project is to develop a fast and reliable detector allowing for an interactive keyword search in tens of hours of recorded meetings. The detector will use a hierarchical approach, where acoustic data are first converted into form of phoneme lattices by phone recognizer. When a keyword is specified, it can be quickly looked up in the lattices. The found keyword occurrences will be further verified using statistical models on acoustic data to increase the keyword detection (en)
V posledních letech se účastníme evropských projektů M4 a AMI. Jedním z úkolů těchto projektů je vývoj nástroje dovolujícího snadnou navigaci v záznamu meetingu, vyhledávání zajímavých částí meetingu a jejich přehrávku. Ukázalo se, že by bylo velmi užitečné rozšířit tento nástroj o funkci rychlého interaktivního vyhledávání klíčových slov. Klasické metody detekce klíčových slov postavené pouze na vyhodnocení statistických akustických modelů jsou pro tento účel příliš pomalé. Cílem tohoto projektu je tedy vývoj rychlého a spolehlivého detektoru klíčových slov dovolujícího interaktivní vyhledávání klíčových slov v řádově desítkách hodinách záznamu meetingů. Pro detektor bude použito hierarchického přístupu. Akustická data budou pomocí fonémového rozpoznávače nejprve konvertována do podoby fonémového svazu. Po zadaní klíčového slova, bude toto slovo ve fonémovém svazu rychle vyhledáno a pro zvýšení spolehlivosti detekce bude dodatečně verifikováno na akustických datech pomocí statistických (cs)