About: Voice Activity Detection in Small Vocabulary Speech Recognition     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
Description
  • Experiments on using voice activity detection (VAD) as a part of the frame dropping method for suppressing the influence of background noise in speech recognition are presented in this work. A speaker independent phoneme-based Czech digit sequence recogniser working in real environment was used for this purpose. A parametrization-based VAD is used here and the results are compared under different conditions - noisy environment, distribution level and auditory-based signal parametrization. The experiments show, that VAD-based frame dropping signal processing can bring the improvement to the recognition in terms of decreasing the insertion error and increasing the speech model preciseness, reaching for up to 20% word error rate enhancement. But the need for the universal setting of the detection algorithm for general environmental conditions brings the detection inaccuracy, which takes effect in the recognition results.
  • Experiments on using voice activity detection (VAD) as a part of the frame dropping method for suppressing the influence of background noise in speech recognition are presented in this work. A speaker independent phoneme-based Czech digit sequence recogniser working in real environment was used for this purpose. A parametrization-based VAD is used here and the results are compared under different conditions - noisy environment, distribution level and auditory-based signal parametrization. The experiments show, that VAD-based frame dropping signal processing can bring the improvement to the recognition in terms of decreasing the insertion error and increasing the speech model preciseness, reaching for up to 20% word error rate enhancement. But the need for the universal setting of the detection algorithm for general environmental conditions brings the detection inaccuracy, which takes effect in the recognition results. (en)
  • Tato práce prezentuje experimenty s detekcí řečové aktivity v rámci potlačování vlivu šumu pozadí řečových nahrávek při rozpoznávání řeči metodou zahazování neřečových segmentů. K tomu účelu byl použit fonémový rozpoznávač sekvence českých číslovek pracující v reálných podmínkách. Metoda používá detektor vycházející z parametrizované podoby signálu. Výsledky jsou srovnávány pro různé podmínky - rozdílné šumové pozadí, rozdílná parametrizace signálu. Výsledky, dosahující až 20% snížení chybovosti rozpoznávače, ukazují výhodnost použití detektoru řeči pro snížení chyby typu inzerce a zvýšení přesnosti modelování fonémů. Nevýhodou použití detektoru je nesnadná optimalizace parametrů pro kvalitní detekci za obecných šumových podmínek. (cs)
Title
  • Voice Activity Detection in Small Vocabulary Speech Recognition
  • Detekce řečové aktivity v rozpoznávači řeči s malým slovníkem (cs)
  • Voice Activity Detection in Small Vocabulary Speech Recognition (en)
skos:prefLabel
  • Voice Activity Detection in Small Vocabulary Speech Recognition
  • Detekce řečové aktivity v rozpoznávači řeči s malým slovníkem (cs)
  • Voice Activity Detection in Small Vocabulary Speech Recognition (en)
skos:notation
  • RIV/68407700:21230/07:03137501!RIV08-GA0-21230___
http://linked.open.../vavai/riv/strany
  • 43;48
http://linked.open...avai/riv/aktivita
http://linked.open...avai/riv/aktivity
  • P(GA102/05/0278), P(GD102/03/H085), Z(MSM6840770014)
http://linked.open...vai/riv/dodaniDat
http://linked.open...aciTvurceVysledku
http://linked.open.../riv/druhVysledku
http://linked.open...iv/duvernostUdaju
http://linked.open...titaPredkladatele
http://linked.open...dnocenehoVysledku
  • 459016
http://linked.open...ai/riv/idVysledku
  • RIV/68407700:21230/07:03137501
http://linked.open...riv/jazykVysledku
http://linked.open.../riv/klicovaSlova
  • noisy environment; speech recognition; voice activity detection (en)
http://linked.open.../riv/klicoveSlovo
http://linked.open...ontrolniKodProRIV
  • [A0A8833EAC98]
http://linked.open...v/mistoKonaniAkce
  • Prague
http://linked.open...i/riv/mistoVydani
  • Prague
http://linked.open...i/riv/nazevZdroje
  • Speech Processing
http://linked.open...in/vavai/riv/obor
http://linked.open...ichTvurcuVysledku
http://linked.open...cetTvurcuVysledku
http://linked.open...vavai/riv/projekt
http://linked.open...UplatneniVysledku
http://linked.open...iv/tvurceVysledku
  • Pollák, Petr
  • Rajnoha, Josef
http://linked.open...vavai/riv/typAkce
http://linked.open.../riv/zahajeniAkce
http://linked.open...n/vavai/riv/zamer
number of pages
http://purl.org/ne...btex#hasPublisher
  • Ústav fotoniky a elektroniky AV ČR
https://schema.org/isbn
  • 978-80-86269-00-9
http://localhost/t...ganizacniJednotka
  • 21230
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 48 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software