HTML Microdata document

This HTML5 document contains 50 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

Namespace Prefixes

Prefix	IRI
dcterms	http://purl.org/dc/terms/
n19	http://localhost/temp/predkladatel/
n17	http://linked.opendata.cz/resource/domain/vavai/projekt/
n15	http://linked.opendata.cz/resource/domain/vavai/riv/tvurce/
n18	http://linked.opendata.cz/resource/domain/vavai/subjekt/
n13	http://linked.opendata.cz/ontology/domain/vavai/
skos	http://www.w3.org/2004/02/skos/core#
rdfs	http://www.w3.org/2000/01/rdf-schema#
n3	http://linked.opendata.cz/ontology/domain/vavai/riv/
n6	http://linked.opendata.cz/ontology/domain/vavai/riv/licencniPoplatek/
n5	http://linked.opendata.cz/resource/domain/vavai/vysledek/RIV%2F49777513%3A23520%2F12%3A43917996%21RIV14-MK0-23520___/
n2	http://linked.opendata.cz/resource/domain/vavai/vysledek/
rdf	http://www.w3.org/1999/02/22-rdf-syntax-ns#
n10	http://linked.opendata.cz/ontology/domain/vavai/riv/vyuzitiJinymSubjektem/
n8	http://linked.opendata.cz/ontology/domain/vavai/riv/klicoveSlovo/
n21	http://linked.opendata.cz/ontology/domain/vavai/riv/duvernostUdaju/
xsdh	http://www.w3.org/2001/XMLSchema#
n20	http://linked.opendata.cz/ontology/domain/vavai/riv/jazykVysledku/
n9	http://linked.opendata.cz/ontology/domain/vavai/riv/aktivita/
n14	http://linked.opendata.cz/ontology/domain/vavai/riv/druhVysledku/
n4	http://linked.opendata.cz/ontology/domain/vavai/riv/obor/
n11	http://reference.data.gov.uk/id/gregorian-year/

Statements

Subject Item: n2:RIV%2F49777513%3A23520%2F12%3A43917996%21RIV14-MK0-23520___
rdf:type: n13:Vysledek skos:Concept
rdfs:seeAlso: http://www.kky.zcu.cz/cs/sw/SEASR-CZE
dcterms:description: The standard ASR system consists of acoustic model, speech parameterization module and language model. The acoustic models in our system are based on the state-of-the-art hidden Markov models (HMM) architecture. Standard 3-state left-to-right models with a mixture of multiple Gaussians in each state are used. Triphone dependencies (including the cross-word ones) are taken into account. The speech data were parameterized as 15-dimensional PLP cepstral features including their delta and delta-delta derivatives (resulting into 45-dimensional feature vectors). These features were computed at the rate of 100 frames per second. Cepstral mean subtraction was applied per speaker. As was already mentioned, non-speech events appearing in spontaneous speech of survivors were also annotated. We used these annotated events to train a generalized model of silence. The state-of-the-art speaker adaptive training and discriminative training algorithms were employed to further improve the quality of the acoustic models. As for language modeling, two basic trigram language models were trained. The first one was estimated using only the acoustic training set transcripts, and the second was trained from the selection of the Czech National Corpus (CNC). The ASR decoder itself can be used in two recognition passes, still keeping the processing in real-time - first pass usually employs general language model and the second one rescores the obtained lattices with a more sophisticated one. At the end, the system generates both word and phoneme lattices for consequent effective search. Standardní systém rozpoznávání řeči sestává z akustického modelu, modulu pro parametrizaci řeči a jazykového modelu. Akustické modely v našem systému jsou založeny na architektuře skrytých Markovových modelů (HMM), která představuje %22lege artis%22 přístup v současném rozpoznávání mluvené řeči. Jsou použity standardní třístavové akustické modely s Gaussovskými směsmi. Model bere v úvahu trifónové závislosti včetně mezislovních. Řeč je parametrizována pomocí 15 PLP koeficientů a jejich delta a delta-delta derivací (tj. vektor příznaků má dimenzi 45). Příznaky jsou extrahovány 100x za vteřinu a je aplikována kepstrální normalizace na úrovni řečníka. Systém obsahuje též zobecněný model ticha a při jeho tvorbě byly použity špičkové metody pro adaptivní a diskriminativní trénování. Pokud se týká jazykového modelu, systém obsahuje dva základní modely - oba trigramové. První z nich je natrénován pouze z pomocí přepisů z %22mateřské%22 domény, zatímco druhý využívá jako trénovací data texty z rozsáhlého Českého národního korpusu. Vlastní řečový dekodér může být použit v dvouprůchodovém režimu (stále ale zajišťujícím zpracování v reálném čase) - v prvním průchodu se většinou používá obecný jazykový model a ve druhém jsou reskórovány získané mřížky modelem sofistikovanějším. Dekodér generuje slovní a fonémové mřížky pro následné efektivní vyhledávání. Standardní systém rozpoznávání řeči sestává z akustického modelu, modulu pro parametrizaci řeči a jazykového modelu. Akustické modely v našem systému jsou založeny na architektuře skrytých Markovových modelů (HMM), která představuje %22lege artis%22 přístup v současném rozpoznávání mluvené řeči. Jsou použity standardní třístavové akustické modely s Gaussovskými směsmi. Model bere v úvahu trifónové závislosti včetně mezislovních. Řeč je parametrizována pomocí 15 PLP koeficientů a jejich delta a delta-delta derivací (tj. vektor příznaků má dimenzi 45). Příznaky jsou extrahovány 100x za vteřinu a je aplikována kepstrální normalizace na úrovni řečníka. Systém obsahuje též zobecněný model ticha a při jeho tvorbě byly použity špičkové metody pro adaptivní a diskriminativní trénování. Pokud se týká jazykového modelu, systém obsahuje dva základní modely - oba trigramové. První z nich je natrénován pouze z pomocí přepisů z %22mateřské%22 domény, zatímco druhý využívá jako trénovací data texty z rozsáhlého Českého národního korpusu. Vlastní řečový dekodér může být použit v dvouprůchodovém režimu (stále ale zajišťujícím zpracování v reálném čase) - v prvním průchodu se většinou používá obecný jazykový model a ve druhém jsou reskórovány získané mřížky modelem sofistikovanějším. Dekodér generuje slovní a fonémové mřížky pro následné efektivní vyhledávání.
dcterms:title: SEASR-CZE - rozpoznávač řeči pro účely vyhledávání s modely pro češtinu SEASR-CZE - speech recognizer for search purposes with models for the Czech language SEASR-CZE - rozpoznávač řeči pro účely vyhledávání s modely pro češtinu
skos:prefLabel: SEASR-CZE - rozpoznávač řeči pro účely vyhledávání s modely pro češtinu SEASR-CZE - speech recognizer for search purposes with models for the Czech language SEASR-CZE - rozpoznávač řeči pro účely vyhledávání s modely pro češtinu
skos:notation: RIV/49777513:23520/12:43917996!RIV14-MK0-23520___
n13:predkladatel: n18:orjk%3A23520
n3:aktivita: n9:P
n3:aktivity: P(DF12P01OVV022)
n3:dodaniDat: n11:2014
n3:domaciTvurceVysledku: n15:6579760 n15:2152517 n15:4979222 n15:8780943 n15:6895972
n3:druhVysledku: n14:R
n3:duvernostUdaju: n21:S
n3:ekonomickeParametry: Výsledek je plánovaným výstupem projektu DF12P01OVV022 %22Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)%22. Slouží k automatickému zpracování audiovizuálního archivu metodami automatického rozpoznávání řeči do formy, která umožňuje rychlé a efektivní vyhledávání zadaných slov či frází.
n3:entitaPredkladatele: n5:predkladatel
n3:idSjednocenehoVysledku: 167121
n3:idVysledku: RIV/49777513:23520/12:43917996
n3:interniIdentifikace: SEASR_CZE
n3:jazykVysledku: n20:cze
n3:klicovaSlova: language model; acoustic model; speech recognition
n3:klicoveSlovo: n8:acoustic%20model n8:speech%20recognition n8:language%20model
n3:kontrolniKodProRIV: [BEA6557B0881]
n3:licencniPoplatek: n6:Z
n3:obor: n4:AJ
n3:pocetDomacichTvurcuVysledku: 5
n3:pocetTvurcuVysledku: 5
n3:projekt: n17:DF12P01OVV022
n3:rokUplatneniVysledku: n11:2012
n3:technickeParametry: Akustické modely - 3-stavové HMM, mezislovní trifónové závislosti, kepstrální normalizace, adaptivní a diskriminativní trénink. Extrakce příznaků - 15 PLP + delta + delta-delta. Jazykový model - trigram. Dekodér - dvouprůchodový, generování slovních a fonémových mřížek.
n3:tvurceVysledku: Švec, Jan Müller, Luděk Pražák, Aleš Psutka jr., Josef Ircing, Pavel
n3:vlastnik: n5:vlastnikVysledku
n3:vyuzitiJinymSubjektem: n10:A
n19:organizacniJednotka: 23520