The main goal of the project is to elaborate and test an automatic method for estimating the structure of Czech complex sentences with regard to a mutual relationship between its clauses on the basis of linguistic evidence.The following tasks are carriedin the proposed project:1. Development of a formal background for the theory of segments and clauses;2. Collecting linguistic evidence and classification of the data;3. Development and implementation of an automatic procedure for segmentation of complex sentences;4. Investigation of a mathematical background of the theory;5. Design of a system of tags for segments and rules for connecting individual segments into clauses;6. Implementation of an automatic procedure connecting individual segments into clauses;7. Re-annotation of a part of data in the Prague Dependency Treebank in order to create testing data;8. Evaluation of the implemented procedures.The segmentation and the subsequent creation of a clause structure of a complex sentence helps to (en)
Hlavním cílem projektu je vývoj a testování automatické metody pro odhad struktury českých souvětí, tedy odhad vzájemných syntaktických vztahů mezi klauzemi v souvětí na základě lingvistické evidence.Projekt se skládá z následujících dílčích úkolů:1. Vývoj formální teorie segmentů a segmentačních schémat;2. Sběr lingvistických dat a jejich klasifikace;3. Vývoj a implementace automatické procedury pro segmentaci souvětí;4. Výzkum formálního matematického modelu pro teorii segmentů;5. Návrh systému značek pro segmenty a návrh pravidel pro spojování segmentů do klauzí;6. Implementace automatické procedury pro spojování segmentů do klauzí;7. Příprava a modifikace dat Pražského závislostního korpusu pro získání testovacích dat;8. Vyhodnocení implementovaných procedur.Segmentace a následný odhad struktury klauzí v souvětí umožňují snížit složitost automatické syntaktické analýzy a tedy zvýšit úspěšnost syntaktických analyzátorů.
Cíle grantového projektu – vývoj a testování automatických metod pro stanovení struktury českých souvětí, tedy odhad vzájemných syntaktických vztahů mezi klauzemi v souvětí na základě lingvistické evidence – byly ve všech plánovaných aspektech naplněny. V rámci projektu byla navržena, implementována a evaluována řada procedur pro automatickou identifikaci segmentů a klauzí. Dalším důležitým v (cs)
The goals of the grant, namely the development and testing of automatic methods for identification of clause structure in Czech complex sentences on the basis of the linguistic evidence, have been fulfilled completely. A whole range of procedures for automatic identification of segments and clauses has been designed, implemented and evaluated in the frame of the project. A test set of high-qual (en)