Attributes | Values |
---|
rdf:type
| |
rdfs:seeAlso
| |
Description
| - Syntactic analysis of sentences is one of the fundamental problems of computational linguistics. At present, the use of supervised approaches that need a large number of syntactically annotated corpora (treebanks) to learn the syntax of language. The disadvantage is the financial and time demands of such a corpus and the need to create a new treebank for each additional language. In this project, we will work on an alternative method. The syntactic relations will be learned automatically from a text corpora with no linguistic annotation. These %22unsupervised%22 methods have recently become very popular and it turns out that, for certain types of tasks, they are better than the supervised methods. Their advantage is their simplicity and their linguistic and domain independence. We will test the induced grammar models in applications where a simple n-gram models currently outperform the syntactic ones, for example in machine translation. Our hypothesis is that the syntactic models based solely on data and not on linguistic rules can improve the machine translation results. (en)
- Syntaktická analýza věty je jedním ze základních problémů počítačové lingvistiky. V současnosti se využívá hlavě tzv. řízených přístupů, které potřebují k naučení syntaxe daného jazyka velké množství syntakticky anotovaných korpusů (treebanků). Nevýhodou je finanční a časová náročnost vytvoření takových korpusů a potřeba pro každý další jazyk vytvářet korpus nový. V tomto projektu se budeme zabývat alternativní metodou, a to učení se syntaktických vztahů automaticky z textových korpusů bez lingvistické anotace. Tyto %22neřízené%22 metody jsou v poslední době velmi populární a ukazuje se, že pro některé typy úloh vhodnější, než metody řízené. Jejich výhodou je jednoduchost a jazyková a doménová nezávsilost. Odvozené modely gramatiky vyzkoušíme v aplikacích, ve kterých jednoduché n-gramové modely v současné době vítězí nad těmi syntaktickými. Takovou aplikací je například strojový překlad. Naše hypotéza je, že syntaktické modely založené pouze na datech a nikoli na lingvistických pravidlech mohou strojový překlad značně vylepšit.
|
Title
| - Sentence structure induction without annotated corpora (en)
- Odvození větné struktury bez anotovaných korpusů
|
skos:notation
| |
http://linked.open...avai/cep/aktivita
| |
http://linked.open...kovaStatniPodpora
| |
http://linked.open...ep/celkoveNaklady
| |
http://linked.open...datumDodatniDoRIV
| |
http://linked.open...i/cep/druhSouteze
| |
http://linked.open...ep/duvernostUdaju
| |
http://linked.open.../cep/fazeProjektu
| |
http://linked.open...ai/cep/hlavniObor
| |
http://linked.open...vai/cep/kategorie
| |
http://linked.open.../cep/klicovaSlova
| - dependency tree, grammar induction, machine learning, unsupervised dependency parsing (en)
|
http://linked.open...ep/partnetrHlavni
| |
http://linked.open...inujicichPrijemcu
| |
http://linked.open...cep/pocetPrijemcu
| |
http://linked.open...ocetSpoluPrijemcu
| |
http://linked.open.../pocetVysledkuRIV
| |
http://linked.open...enychVysledkuVRIV
| |
http://linked.open...lneniVMinulemRoce
| |
http://linked.open.../prideleniPodpory
| |
http://linked.open...iciPoslednihoRoku
| |
http://linked.open...atUdajeProjZameru
| |
http://linked.open.../vavai/cep/soutez
| |
http://linked.open...usZobrazovaneFaze
| |
http://linked.open...ai/cep/typPojektu
| |
http://linked.open...ep/ukonceniReseni
| |
http://linked.open.../cep/vedlejsiObor
| |
http://linked.open...ep/zahajeniReseni
| |
http://linked.open...tniCyklusProjektu
| |
http://linked.open.../cep/klicoveSlovo
| - grammar induction
- machine learning
- dependency tree
|
is http://linked.open...vavai/cep/projekt
of | |