About: Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
Description
  • Příspěvek se zabývá možností konstrukce jazykového modelu pro rozpoznávač mluvené řeči v českém jazyce s velkým slovníkem. Český jazyk samotný obsahuje kolem 300 tisíc slov v základní formě a cca 5 miliónů slov ve všech formách (ohýbání, skloňování). Základní myšlenka příspěvku spočívá v reprezentaci jazykového modelu běžným n-gramovým modelem vytvořeným pouze z několika tříd (260 ti), které v podstatě reprezentují slovní druhy v daném tvaru. Takto vytvořený jazykový model je použit pro nalezení nejlepší (nejpravděpodobnější) posloupnosti slov.
  • Příspěvek se zabývá možností konstrukce jazykového modelu pro rozpoznávač mluvené řeči v českém jazyce s velkým slovníkem. Český jazyk samotný obsahuje kolem 300 tisíc slov v základní formě a cca 5 miliónů slov ve všech formách (ohýbání, skloňování). Základní myšlenka příspěvku spočívá v reprezentaci jazykového modelu běžným n-gramovým modelem vytvořeným pouze z několika tříd (260 ti), které v podstatě reprezentují slovní druhy v daném tvaru. Takto vytvořený jazykový model je použit pro nalezení nejlepší (nejpravděpodobnější) posloupnosti slov. (cs)
  • This contribution deals with the construction of language model (LM) for Czech large vocabulary continuous speech recogniser (LVCSR). Czech language contains about 300 thousand words in basic form and about 5 millions of words in different forms (declensions, inflections). The main idea of this work is in representation of LM with standard n-gram model based on several classes (260) which represent all word classes in the given form. Such LM is used to find the best (most likely) word sequence. (en)
Title
  • Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka
  • Use n-gram based on word classes for Czech speech recognition (en)
  • Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka (cs)
skos:prefLabel
  • Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka
  • Use n-gram based on word classes for Czech speech recognition (en)
  • Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka (cs)
skos:notation
  • RIV/68407700:21230/07:03137207!RIV08-GA0-21230___
http://linked.open.../vavai/riv/strany
  • 43;48
http://linked.open...avai/riv/aktivita
http://linked.open...avai/riv/aktivity
  • P(GA102/05/0278), P(GD102/03/H085), Z(MSM6840770014)
http://linked.open...vai/riv/dodaniDat
http://linked.open...aciTvurceVysledku
http://linked.open.../riv/druhVysledku
http://linked.open...iv/duvernostUdaju
http://linked.open...titaPredkladatele
http://linked.open...dnocenehoVysledku
  • 443031
http://linked.open...ai/riv/idVysledku
  • RIV/68407700:21230/07:03137207
http://linked.open...riv/jazykVysledku
http://linked.open.../riv/klicovaSlova
  • language model; large vocabulary; speech recognition (en)
http://linked.open.../riv/klicoveSlovo
http://linked.open...ontrolniKodProRIV
  • [00FC2A812E3C]
http://linked.open...v/mistoKonaniAkce
  • Praha
http://linked.open...i/riv/mistoVydani
  • Praha
http://linked.open...i/riv/nazevZdroje
  • Analýza a zpracování řečových a biologických signálů
http://linked.open...in/vavai/riv/obor
http://linked.open...ichTvurcuVysledku
http://linked.open...cetTvurcuVysledku
http://linked.open...vavai/riv/projekt
http://linked.open...UplatneniVysledku
http://linked.open...iv/tvurceVysledku
  • Štemberk, Pavel
http://linked.open...vavai/riv/typAkce
http://linked.open.../riv/zahajeniAkce
http://linked.open...n/vavai/riv/zamer
number of pages
http://purl.org/ne...btex#hasPublisher
  • České vysoké učení technické v Praze
https://schema.org/isbn
  • 978-80-01-03940-3
http://localhost/t...ganizacniJednotka
  • 21230
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 67 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software