Description
| - Záměrem projektu je vytyčit první kontury principiálně nového gramatického popisu češtiny, založeného na gramatické analýze velkých a žánrově reprezentativních počítačových korpusů textů. Projekt je koncipován primárně jako strukturovaný týmový výzkumtypických monopolních i konkurenčních, včetně periferních gramatických forem a struktur soudobé češtiny vzhledem k tomu, jak jsou či nejsou obsaženy v Českém národním korpusu, a to v jeho centrální a největší složce, nazvané SYN 2000 (dále ČNK),obsahující v současnosti 100 milionů slovních forem, a v Pražském závislostním korpusu. Konkrétně patří k záměru projektu na bázi ČNK: (a) evidovat problémové jevy velmi či značně frekventované, které navzdory tomu nebyly dosud v gramatikách představenybuď vůbec, anebo jen neúplně či nahodile; (b) evidovat i jevy málo frekventované, mezní a řídké nebo sporné, jejichž popis dosud buď zcela schází, anebo je neúplný, nahodilý či mylný vzhledem k tomu, že - ve srovnání s nynějšími možnostmi - vycházel z (cs)
- The goal of this project is to map the initial contours of a fundamentally new grammatical description of Czech based on the grammatical analysis of large, genre-balanced corpora of texts. The project is conceived primarily in terms of structuredteam-based research into typical monopolistic and competitive forms, including those grammatical and structural forms which are peripheral in contemporary Czech, with respect to how they are or are not reflected in the Czech National Corpus -specifically in its largest and most central component, called SYN 2000 (henceforth CNC), which currently contains 100 million word forms, and the Prague Dependence Corpus. Specifically, this project aims to use the Czech National Corpus to: (a) recordproblematic features found very frequently or with significant frequency, which despite this frequency have up till now either not been described in grammars at all, or have been described only incompletely or haphazardly; (b) record features that are (en)
|