The main goal of the project is to elaborate and test an automatic method for estimating the structure of Czech complex sentences with regard to a mutual relationship between its clauses on the basis of linguistic evidence.The following tasks are carriedin the proposed project:1. Development of a formal background for the theory of segments and clauses;2. Collecting linguistic evidence and classification of the data;3. Development and implementation of an automatic procedure for segmentation of complex sentences;4. Investigation of a mathematical background of the theory;5. Design of a system of tags for segments and rules for connecting individual segments into clauses;6. Implementation of an automatic procedure connecting individual segments into clauses;7. Re-annotation of a part of data in the Prague Dependency Treebank in order to create testing data;8. Evaluation of the implemented procedures.The segmentation and the subsequent creation of a clause structure of a complex sentence helps to (en)
Hlavním cílem projektu je vývoj a testování automatické metody pro odhad struktury českých souvětí, tedy odhad vzájemných syntaktických vztahů mezi klauzemi v souvětí na základě lingvistické evidence.Projekt se skládá z následujících dílčích úkolů:1. Vývoj formální teorie segmentů a segmentačních schémat;2. Sběr lingvistických dat a jejich klasifikace;3. Vývoj a implementace automatické procedury pro segmentaci souvětí;4. Výzkum formálního matematického modelu pro teorii segmentů;5. Návrh systému značek pro segmenty a návrh pravidel pro spojování segmentů do klauzí;6. Implementace automatické procedury pro spojování segmentů do klauzí;7. Příprava a modifikace dat Pražského závislostního korpusu pro získání testovacích dat;8. Vyhodnocení implementovaných procedur.Segmentace a následný odhad struktury klauzí v souvětí umožňují snížit složitost automatické syntaktické analýzy a tedy zvýšit úspěšnost syntaktických analyzátorů. (cs)