About: Czech National Corpus

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Czech National Corpus Goto Sponge NotDistinct Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

Attributes	Values
rdf:type	http://linked.opendata.cz/ontology/domain/vavai/Projekt
rdfs:seeAlso	http://www.isvav.cz/projectDetail.do?rowId=LM2011023
Description	The Czech National Corpus (CNC) strives for extensive and continuous data coverage of the Czech language (and other languages in comparison with Czech) aiming thus to build up a foundation for basic and applied research. The CNC is the only project of its kind in the Czech Republic and due to its current results (set of corpora containing more than 1.3 billion tokens in total), it ranks among the foremost corpus research centres in the world. The CNC objective is mainly continuous development and building of language corpora of various types as representative, linguistically processed textual bases for empirical and exact research of the Czech language; these are primarily corpora covering Czech in its present state (synchronic corpora of written and spoken language), in its historical development (diachronic corpus), and in translation comparison with other languages (parallel corpora). This is closely related to versatile, continually developed and improved structural and specialized linguistic annotation of these corpora. Upon request, the CNC will also cater for comprehensive processing of other corpora created at different institutes in the Czech Republic and abroad, as well as maintaining public access to them. An integral part of the project is providing free and open public service of internet user access to all corpora through specialized corpus tools, including related administration, user service and development of these tools. This is connected to providing of data packages (i.e. processed and annotated collections of language data) to other institutions and individual users in the Czech Republic as well as abroad, in various forms and formats according to the users’ needs, with applications ranging from linguistic research to natural language processing. (en) Český národní korpus (ČNK) usiluje o extenzívní a kontinuální datové pokrývání češtiny (a dalších jazyků ve srovnání s ní) a cíleně tak buduje bázi pro základní i aplikovaný výzkum. ČNK představuje jediný projekt svého druhu v České republice a svými dosavadními výsledky (nabídka korpusů o celkovém rozsahu více 1,3 miliardy textových slov) se řadí k předním korpusovým pracovištím i ve světovém měřítku. Cílem činnosti ČNK je především kontinuální rozvoj a budování jazykových korpusů různých typů jako reprezentativní lingvisticky zpracované datové základny pro empirický a exaktní výzkum českého jazyka; jde především o korpusy zachycující češtinu v jejím současném stavu (synchronní korpusy psaného a mluveného jazyka), v jejím historickém vývoji (diachronní korpus) a v překladovém srovnání s jinými jazyky (paralelní korpusy). S tím úzce souvisí i mnohostranná, trvale rozvíjená a zdokonalovaná strukturní a lingvistická anotace těchto korpusů. ČNK bude na požádání zajišťovat také komplexní zpracování dalších korpusů vzniklých na jiných pracovištích v ČR i v zahraničí a veřejný přístup k nim. Nedílnou součástí projektu je bezplatná a otevřená veřejná služba poskytování internetového uživatelského přístupu ke všem korpusům pomocí specializovaných korpusových nástrojů, včetně související správy, uživatelského servisu a vývoje těchto nástrojů. S tím je spojeno také poskytování datových balíčků (tj. zpracovaných a anotovaných souborů jazykových dat) dalším institucím i individuálním uživatelům v ČR i v zahraničí, v různých podobách a formátech podle potřeb těchto uživatelů, s využitím zejména pro jazykovědný výzkum a počítačové zpracování přirozeného jazyka.
Title	Czech National Corpus (en) Český národní korpus
skos:notation	LM2011023
http://linked.open...avai/cep/aktivita	Large RDI infrastructures projects
http://linked.open...kovaStatniPodpora	http://linked.opendata.cz/resource/domain/vavai/projekt/LM2011023/celkovaStatniPodpora
http://linked.open...ep/celkoveNaklady	http://linked.opendata.cz/resource/domain/vavai/projekt/LM2011023/celkoveNaklady
http://linked.open...datumDodatniDoRIV	2015-02-16 (xsd:date)
http://linked.open...ep/duvernostUdaju	S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
http://linked.open.../cep/fazeProjektu	101134678
http://linked.open...ai/cep/hlavniObor	AI - Jazykověda
http://linked.open...vai/cep/kategorie	IF - Infrastruktura výzkumu a vývoje
http://linked.open.../cep/klicovaSlova	corpus; linguisitc data (en)
http://linked.open...ep/partnetrHlavni	Filozofická fakulta
http://linked.open...inujicichPrijemcu	0 (xsd:int)
http://linked.open...cep/pocetPrijemcu	1 (xsd:int)
http://linked.open...ocetSpoluPrijemcu	0 (xsd:int)
http://linked.open.../pocetVysledkuRIV	46 (xsd:int)
http://linked.open...enychVysledkuVRIV	46 (xsd:int)
http://linked.open...lneniVMinulemRoce	2014-04-30 (xsd:date)
http://linked.open.../prideleniPodpory	http://linked.opendata.cz/resource/domain/vavai/cep/prideleniPodpory/MSMT-15363%2F2012-32
http://linked.open...iciPoslednihoRoku	2015
http://linked.open...atUdajeProjZameru	2015
http://linked.open...usZobrazovaneFaze	DRRVB
http://linked.open...ai/cep/typPojektu	P - Projekt výzkumu a vývoje financovaný ze státního rozpočtu
http://linked.open...ep/ukonceniReseni	2016-12-31 (xsd:date)
http://linked.open.../cep/vedlejsiObor	AF - Dokumentace, knihovnictví, práce s informacemi
http://linked.open...ep/zahajeniReseni	2012-01-01 (xsd:date)
http://linked.open...tniCyklusProjektu	ZBBB
http://linked.open.../cep/klicoveSlovo	corpus
is http://linked.open...vavai/riv/projekt of	Multi-tier Transcription of Informal Spoken Czech:The ORTOFON Corpus Approach All you ever wanted to know about corpus but were afraid to ask! All you ever wanted to know about corpus and were afraid to ask A System for Syntactic Annotation of Large Czech Corpora InterText editor InterCorp (release 6) A Tool for corpus based derivational analysis ORAL2013 - reprezentativní korpus neformální mluvené češtiny Query interface for diverse corpus types About the Faculty of Arts, Charles University in Prague The case of InterCorp, a multilingual parallel corpus InterCorp: A Contribution to Interlinguistics InterCorp - 22 European languages within 1 interface Don't play with the devil, play with the corpus! InterText web (server) SYN2013PUB - corpus of Czech newspapers InterCorp (release 7) Zdrobnienia jako element kultury i pułapka glottodydaktyczna : czeskie i polskie deminutiva w ujęciu konfrontatywnym na podstawie badań korpusowych. Mluvený jazyk a korpusy Identification of Idioms in Spoken Corpora Annotating foreign learners' Czech The Czech National Corpus Language and Corpus Corpus workshop for pupils Seznamte se s Českým národním korpusem Seznamte se s Českým národním korpusem II The SYN-series corpora of written Czech Combining Manual and Automatic Annotation of a Learner Corpus Morfio Between lexical meaning and valency : towards a method for extracting equivalents based on a parallel corpus Building a Data Repository of Spontaneous Spoken Czech Building a learner corpus A 3D taxonomy of word classes at work Park - interface for querying parallel corpora Balanced data repository of spontaneous spoken Czech Building a multilingual parallel corpus for human users KWords KonText: corpus query interface Corpora in Contrastive Linguistics and Translation Studies Diachronní složka Českého národního korpusu a hranice možností korpusového výzkumu vývoje češtiny Czego nie można wyrazić w języku polskim, czyli o leksykalnych w nim brakach CzeSL-SGT Praktyczny przewodnik po korpusie równoległym InterCorp Aligning parallel texts with InterText AKCES 5 (CzeSL-SGT) Release 2 Mapping Diatopic and Diachronic Variation in Spoken Czech: the ORTOFON and DIALEKT Corpora
is http://linked.open...vavai/cep/projekt of	http://linked.opendata.cz/resource/domain/vavai/cep/ucast/LM2011023/2012/orjk%3A11210 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/LM2011023/2013/orjk%3A11210 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/LM2011023/2014/orjk%3A11210 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/LM2011023/2015/orjk%3A11210 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/LM2011023/2016/orjk%3A11210

Faceted Search & Find service v1.16.116 as of Feb 22 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3239 as of Feb 22 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 80 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software