About: Czech National Corpus     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • The Czech National Corpus (CNC) strives for extensive and continuous data coverage of the Czech language (and other languages in comparison with Czech) aiming thus to build up a foundation for basic and applied research. The CNC is the only project of its kind in the Czech Republic and due to its current results (set of corpora containing more than 1.3 billion tokens in total), it ranks among the foremost corpus research centres in the world. The CNC objective is mainly continuous development and building of language corpora of various types as representative, linguistically processed textual bases for empirical and exact research of the Czech language; these are primarily corpora covering Czech in its present state (synchronic corpora of written and spoken language), in its historical development (diachronic corpus), and in translation comparison with other languages (parallel corpora). This is closely related to versatile, continually developed and improved structural and specialized linguistic annotation of these corpora. Upon request, the CNC will also cater for comprehensive processing of other corpora created at different institutes in the Czech Republic and abroad, as well as maintaining public access to them. An integral part of the project is providing free and open public service of internet user access to all corpora through specialized corpus tools, including related administration, user service and development of these tools. This is connected to providing of data packages (i.e. processed and annotated collections of language data) to other institutions and individual users in the Czech Republic as well as abroad, in various forms and formats according to the users’ needs, with applications ranging from linguistic research to natural language processing. (en)
  • Český národní korpus (ČNK) usiluje o extenzívní a kontinuální datové pokrývání češtiny (a dalších jazyků ve srovnání s ní) a cíleně tak buduje bázi pro základní i aplikovaný výzkum. ČNK představuje jediný projekt svého druhu v České republice a svými dosavadními výsledky (nabídka korpusů o celkovém rozsahu více 1,3 miliardy textových slov) se řadí k předním korpusovým pracovištím i ve světovém měřítku. Cílem činnosti ČNK je především kontinuální rozvoj a budování jazykových korpusů různých typů jako reprezentativní lingvisticky zpracované datové základny pro empirický a exaktní výzkum českého jazyka; jde především o korpusy zachycující češtinu v jejím současném stavu (synchronní korpusy psaného a mluveného jazyka), v jejím historickém vývoji (diachronní korpus) a v překladovém srovnání s jinými jazyky (paralelní korpusy). S tím úzce souvisí i mnohostranná, trvale rozvíjená a zdokonalovaná strukturní a lingvistická anotace těchto korpusů. ČNK bude na požádání zajišťovat také komplexní zpracování dalších korpusů vzniklých na jiných pracovištích v ČR i v zahraničí a veřejný přístup k nim. Nedílnou součástí projektu je bezplatná a otevřená veřejná služba poskytování internetového uživatelského přístupu ke všem korpusům pomocí specializovaných korpusových nástrojů, včetně související správy, uživatelského servisu a vývoje těchto nástrojů. S tím je spojeno také poskytování datových balíčků (tj. zpracovaných a anotovaných souborů jazykových dat) dalším institucím i individuálním uživatelům v ČR i v zahraničí, v různých podobách a formátech podle potřeb těchto uživatelů, s využitím zejména pro jazykovědný výzkum a počítačové zpracování přirozeného jazyka.
Title
  • Czech National Corpus (en)
  • Český národní korpus
skos:notation
  • LM2011023
http://linked.open...avai/cep/aktivita
http://linked.open...kovaStatniPodpora
http://linked.open...ep/celkoveNaklady
http://linked.open...datumDodatniDoRIV
http://linked.open...ep/duvernostUdaju
http://linked.open.../cep/fazeProjektu
http://linked.open...ai/cep/hlavniObor
http://linked.open...vai/cep/kategorie
http://linked.open.../cep/klicovaSlova
  • corpus; linguisitc data (en)
http://linked.open...ep/partnetrHlavni
http://linked.open...inujicichPrijemcu
http://linked.open...cep/pocetPrijemcu
http://linked.open...ocetSpoluPrijemcu
http://linked.open.../pocetVysledkuRIV
http://linked.open...enychVysledkuVRIV
http://linked.open...lneniVMinulemRoce
http://linked.open.../prideleniPodpory
http://linked.open...iciPoslednihoRoku
http://linked.open...atUdajeProjZameru
http://linked.open...usZobrazovaneFaze
http://linked.open...ai/cep/typPojektu
http://linked.open...ep/ukonceniReseni
http://linked.open.../cep/vedlejsiObor
http://linked.open...ep/zahajeniReseni
http://linked.open...tniCyklusProjektu
http://linked.open.../cep/klicoveSlovo
  • corpus
is http://linked.open...vavai/riv/projekt of
is http://linked.open...vavai/cep/projekt of
Faceted Search & Find service v1.16.116 as of Feb 22 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3239 as of Feb 22 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 80 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software