About: Very Large Language Corpora and Their Automatic Analysis

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Very Large Language Corpora and Their Automatic Analysis Goto Sponge NotDistinct Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

Attributes	Values
rdf:type	http://linked.opendata.cz/ontology/domain/vavai/Projekt
rdfs:seeAlso	http://www.isvav.cz/projectDetail.do?rowId=GA405/03/0913
Description	Language corpora are an indispensable part of current linguistic research. They are used for various purposes, from simple lookup for particular words to sophisticated use for automatic computer training in statistical language modeling or automaticanalysis at various levels performed fully automatically on a computer. Usability of both monolingual as well as multilingual and spoken language corpora is substantially enhanced if the language material contained in them is linguistically analyzed.Annotation can reflect both the form and the function of linguistic units in their context. The primary goal of the project is to enhance our understanding of the natural language system in general and Czech in particular, and to develop and/or enhancestatistical machine learning and symbolical methods (and their combinations) in order to be able to automatically analyze large quantities of naturally occurring texts, whether they are written or spoken. Results of previous projects in the field will be (en) Jazykové korpusy jsou nezastupitelnou součástí lingvistického výzkumu. Používají se za různým účelem, od jednoduchého vyhledávání daných slov až po přímé využití pro tzv. trénování v metodách automatického strojového učení; tyto metody se používají např.pro pravděpodobnostní jazykové modelování či automatickou počítačovou analýzu vět přirozeného jazyka. Použitelnost a užitečnost jazykových textových a řečových korpusů (včetně vícejazyčných) je umocněna jejich lingvistickou analýzou (anotováním). Anotacemůže odrážet jak formu, strukturu i funkci jazykových jednotek obsažených v anotovaném textu.Základním cílem projektu je obohatit naše dosavadní znalosti o jazykovém systému obecně a češtině zvlášť, a to ve smyslu vyvinutí takových metod (zejména metodstatistického strojového učení a metod symbolických, a jejich kombinací), aby bylo možno s vysokou přesností analyzovat velké jazykové korpusy jak psaného, tak mluveného textu. Bude se přitom využívat výsledků dosažené v předchozích projektech a grantech
Title	Very Large Language Corpora and Their Automatic Analysis (en) Velké jazykové korpusy a jejich automatická analýza
skos:notation	GA405/03/0913
http://linked.open...avai/cep/aktivita	Standard projects
http://linked.open...kovaStatniPodpora	http://linked.opendata.cz/resource/domain/vavai/projekt/GA405%2F03%2F0913/celkovaStatniPodpora
http://linked.open...ep/celkoveNaklady	http://linked.opendata.cz/resource/domain/vavai/projekt/GA405%2F03%2F0913/celkoveNaklady
http://linked.open...datumDodatniDoRIV	2009-01-15 (xsd:date)
http://linked.open...i/cep/druhSouteze	VS - Veřejná soutěž ve výzkumu a vývoji
http://linked.open...ep/duvernostUdaju	S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
http://linked.open.../cep/fazeProjektu	33436605
http://linked.open...ai/cep/hlavniObor	AI - Jazykověda
http://linked.open...hodnoceniProjektu	V - Vynikající výsledky (s mezinárodním významem apod.). Zároveň byly splněny cíle a předpokládané výsledky uvedené ve smlouvě / rozhodnutí o poskytnutí podpory.
http://linked.open...vai/cep/kategorie	ZV - Základní výzkum
http://linked.open.../cep/klicovaSlova	Neuvedeno. (en)
http://linked.open...ep/partnetrHlavni	Matematicko-fyzikální fakulta
http://linked.open...inujicichPrijemcu	0 (xsd:int)
http://linked.open...cep/pocetPrijemcu	1 (xsd:int)
http://linked.open...ocetSpoluPrijemcu	2 (xsd:int)
http://linked.open.../pocetVysledkuRIV	20 (xsd:int)
http://linked.open...enychVysledkuVRIV	20 (xsd:int)
http://linked.open...okUkonceniPodpory	2005
http://linked.open...okZahajeniPodpory	2003
http://linked.open...iciPoslednihoRoku	2006
http://linked.open...atUdajeProjZameru	2006
http://linked.open.../vavai/cep/soutez	SGA02003GA-ST
http://linked.open...usZobrazovaneFaze	DUU
http://linked.open...ai/cep/typPojektu	P - Projekt výzkumu a vývoje financovaný ze státního rozpočtu
http://linked.open.../cep/vedlejsiObor	JD - Využití počítačů, robotika a její aplikace
http://linked.open...jektu+dodavatelem	Cíle projektu byly beze zbytku splněny. Výsledkem projektu je kromě více než 25 publikací řada softwarových nástrojů pro zpracování textových korpusů. Tyto textové korpusy jsou veřejně přístupné. Jde o korpusy češtiny i dalších jazyků, a to včetně parale (cs) The goals of the project have been fully met. The results of the project include, on top of its 25+ published papers and reports (including one book on Czech computational morphology), a suite of software tools for corpus maintenance and exploitation and (en)
http://linked.open...tniCyklusProjektu	ZBKU
is http://linked.open...vavai/riv/projekt of	Corpus Analysis for Lexical Database Construction: A Case of Russian and Czech Wordnets Derivational relations in flectional languages - Czech case Grammatical Heads Optimized for Parsing and Their Comparison with Linguistic Intuition Reliable Morphological Disambiguation of Czech: Rule-Based Approach is Necessary Automatic analyser of Czech language at the tectogrammatical layer Combination of a Hidden Tag Model and a Traditional N-gram Model: A Case Study in Czech Speech Recognition The Computational Complexity of Rule-Based Part-of-Speech Tagging Syntactic analysis of natural languages based on context free grammar backbone Annotation Lexicons: Using the Valency Lexicon for Tectogrammatical Annotation Aktualizace rozvržení zdrojů Českého národního korpusu s ohledem na revizi vyváženosti jeho struktury Jak využívat Český národní korpus Disambiguation of Rich Inflection (Computational Morphology of Czech) Transformation-Based Tectogrammatical Analysis of Czech Využití pravidel pro negaci v automatickém značkování českých korpusů Language for Grammatical Rules Linguistic Annotation: from Links to Cross-Layer Lexicons PDT-VALLEX: Creating a Large-coverage Valency Lexicon for Treebank Annotation Using a Czech Valency Lexicon for Annotation Support Multiverb expressions in Czech Project of corpus hungarian dictionary.
is http://linked.open...vavai/cep/projekt of	http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2007/ico%3A68378092 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2007/orjk%3A11320 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2007/orjk%3A14330 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2003/ico%3A68378092 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2003/orjk%3A11320 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2003/orjk%3A14330 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2004/ico%3A68378092 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2004/orjk%3A11320 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2004/orjk%3A14330 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2005/ico%3A68378092 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2005/orjk%3A11320 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2005/orjk%3A14330 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2006/ico%3A68378092 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2006/orjk%3A11320 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA405%2F03%2F0913/2006/orjk%3A14330

Faceted Search & Find service v1.16.118 as of Jun 21 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 14 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2025 OpenLink Software