About: Czech Spontaneaous Speech – Acoustic&Language Models (MALACH)     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
Description
  • The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 570 Czech testimonies with a total length of 1 200 hours. It is not feasible to transcribe all those testimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system – data forthe system development were acquired from the Czech Malach Speech Corpus. The basic AM unit is a triphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 6699 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.
  • The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 570 Czech testimonies with a total length of 1 200 hours. It is not feasible to transcribe all those testimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system – data forthe system development were acquired from the Czech Malach Speech Corpus. The basic AM unit is a triphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 6699 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models. (en)
  • Visual History Foundation shromáždila v minulých létech cca 52 tisíc výpovědí svědků holocaustu namluvených ve 32 jazycích. Českých výpovědí je k dispozici cca 570 s celkovou délkou asi 1 200 hodin. Vzhledem k značné časové a finanční náročnosti není možné provést přepisy všech výpovědí manuálně. K přepisu bylo proto využito systému automatického rozpoznávání řeči. Data pro tvorbu modelů byla získána z Czech Malach Speech Corpusu. Základní jednotkou AM je trifón reprezentovaný 5ti stavovým HMM, kde každý stav je modelován 16ti složkovým GMM. Aplikací fonetického shlukovacího stromu byl počet stavů snížen na 6699. Jazykový model je tvořen kombinací 2 bigramov (cs)
Title
  • Czech Spontaneaous Speech – Acoustic&Language Models (MALACH)
  • Akustický a jazykový model spontánní češtiny (cs)
  • Czech Spontaneaous Speech – Acoustic&Language Models (MALACH) (en)
skos:prefLabel
  • Czech Spontaneaous Speech – Acoustic&Language Models (MALACH)
  • Akustický a jazykový model spontánní češtiny (cs)
  • Czech Spontaneaous Speech – Acoustic&Language Models (MALACH) (en)
skos:notation
  • RIV/49777513:23520/05:00000001!RIV07-AV0-23520___
http://linked.open...avai/riv/aktivita
http://linked.open...avai/riv/aktivity
  • P(1QS101470516), P(LC536)
http://linked.open...vai/riv/dodaniDat
http://linked.open...aciTvurceVysledku
http://linked.open.../riv/druhVysledku
http://linked.open...iv/duvernostUdaju
http://linked.open...onomickeParametry
  • SW produkt je využíván k rozpoznávání českých výpovědí pořízených VHF. Rozpoznaný text je dále zpracováván pro hledaní topiků a detekci klíčových slov.
http://linked.open...titaPredkladatele
http://linked.open...dnocenehoVysledku
  • 516829
http://linked.open...ai/riv/idVysledku
  • RIV/49777513:23520/05:00000001
http://linked.open...terniIdentifikace
  • FAV-SW-03-05
http://linked.open...riv/jazykVysledku
http://linked.open...vai/riv/kategorie
http://linked.open.../riv/klicovaSlova
  • Czech acoustic model; Czech language model; Speech recognition (en)
http://linked.open.../riv/klicoveSlovo
http://linked.open...ontrolniKodProRIV
  • [11A4FFC4F948]
http://linked.open.../licencniPoplatek
http://linked.open...okalizaceVysledku
  • SW produkt vznikl na katedře kybernetiky, ZČU v Plzni. SW byl poskytnut Visual History Foundation v L.A., Johns Hopkins University v Baltimore a University of Maryland.
http://linked.open...in/vavai/riv/obor
http://linked.open...ichTvurcuVysledku
http://linked.open...cetTvurcuVysledku
http://linked.open...vavai/riv/projekt
http://linked.open...UplatneniVysledku
http://linked.open...echnickeParametry
  • SW produkt se skládá z akustického(AM) a jazykového(LM) modelu. AM: z 100h řeči, param. PLP 27 filtrů 51 koef., 6699 listů.LM kombinace 2 bigr. modelů přepisy(610 tis.) a dodatečná data(16 mil. slov).
http://linked.open...iv/tvurceVysledku
  • Ircing, Pavel
  • Psutka, Josef
http://linked.open...avai/riv/vlastnik
http://linked.open...itiJinymSubjektem
http://localhost/t...ganizacniJednotka
  • 23520
is http://linked.open...avai/riv/vysledek of
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 78 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software