About: Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka Goto Sponge NotDistinct Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

Attributes	Values
rdf:type	skos:Concept http://linked.opendata.cz/ontology/domain/vavai/Vysledek
Description	Příspěvek se zabývá možností konstrukce jazykového modelu pro rozpoznávač mluvené řeči v českém jazyce s velkým slovníkem. Český jazyk samotný obsahuje kolem 300 tisíc slov v základní formě a cca 5 miliónů slov ve všech formách (ohýbání, skloňování). Základní myšlenka příspěvku spočívá v reprezentaci jazykového modelu běžným n-gramovým modelem vytvořeným pouze z několika tříd (260 ti), které v podstatě reprezentují slovní druhy v daném tvaru. Takto vytvořený jazykový model je použit pro nalezení nejlepší (nejpravděpodobnější) posloupnosti slov. Příspěvek se zabývá možností konstrukce jazykového modelu pro rozpoznávač mluvené řeči v českém jazyce s velkým slovníkem. Český jazyk samotný obsahuje kolem 300 tisíc slov v základní formě a cca 5 miliónů slov ve všech formách (ohýbání, skloňování). Základní myšlenka příspěvku spočívá v reprezentaci jazykového modelu běžným n-gramovým modelem vytvořeným pouze z několika tříd (260 ti), které v podstatě reprezentují slovní druhy v daném tvaru. Takto vytvořený jazykový model je použit pro nalezení nejlepší (nejpravděpodobnější) posloupnosti slov. (cs) This contribution deals with the construction of language model (LM) for Czech large vocabulary continuous speech recogniser (LVCSR). Czech language contains about 300 thousand words in basic form and about 5 millions of words in different forms (declensions, inflections). The main idea of this work is in representation of LM with standard n-gram model based on several classes (260) which represent all word classes in the given form. Such LM is used to find the best (most likely) word sequence. (en)
Title	Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka Use n-gram based on word classes for Czech speech recognition (en) Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka (cs)
skos:prefLabel	Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka Use n-gram based on word classes for Czech speech recognition (en) Použití n-gramu založeného na slovních druzích pro tvorbu rozpoznávače českého jazyka (cs)
skos:notation	RIV/68407700:21230/07:03137207!RIV08-GA0-21230___
http://linked.open.../vavai/riv/strany	43;48
http://linked.open...avai/riv/aktivita	P Z
http://linked.open...avai/riv/aktivity	P(GA102/05/0278), P(GD102/03/H085), Z(MSM6840770014)
http://linked.open...vai/riv/dodaniDat	2008
http://linked.open...aciTvurceVysledku	Štemberk, Pavel
http://linked.open.../riv/druhVysledku	D - Článek ve sborníku
http://linked.open...iv/duvernostUdaju	S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
http://linked.open...titaPredkladatele	České vysoké učení technické v Praze / Fakulta elektrotechnická
http://linked.open...dnocenehoVysledku	443031
http://linked.open...ai/riv/idVysledku	RIV/68407700:21230/07:03137207
http://linked.open...riv/jazykVysledku	cze - čeština
http://linked.open.../riv/klicovaSlova	language model; large vocabulary; speech recognition (en)
http://linked.open.../riv/klicoveSlovo	large vocabulary language model speech recognition
http://linked.open...ontrolniKodProRIV	[00FC2A812E3C]
http://linked.open...v/mistoKonaniAkce	Praha
http://linked.open...i/riv/mistoVydani	Praha
http://linked.open...i/riv/nazevZdroje	Analýza a zpracování řečových a biologických signálů
http://linked.open...in/vavai/riv/obor	JA
http://linked.open...ichTvurcuVysledku	1 (xsd:int)
http://linked.open...cetTvurcuVysledku	1 (xsd:int)
http://linked.open...vavai/riv/projekt	Biological and speech signal modelling New trends in research and application of voice technology
http://linked.open...UplatneniVysledku	2007
http://linked.open...iv/tvurceVysledku	Štemberk, Pavel
http://linked.open...vavai/riv/typAkce	CST - Celostátní
http://linked.open.../riv/zahajeniAkce	2007-11-15 (xsd:date)
http://linked.open...n/vavai/riv/zamer	Výzkum perspektivních informačních a komunikačních technologií
number of pages	6 (xsd:int)
http://purl.org/ne...btex#hasPublisher	České vysoké učení technické v Praze
https://schema.org/isbn	978-80-01-03940-3
http://localhost/t...ganizacniJednotka	21230

Faceted Search & Find service v1.16.118 as of Jun 21 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 67 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software