About: Sentence structure induction without annotated corpora     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • Syntactic analysis of sentences is one of the fundamental problems of computational linguistics. At present, the use of supervised approaches that need a large number of syntactically annotated corpora (treebanks) to learn the syntax of language. The disadvantage is the financial and time demands of such a corpus and the need to create a new treebank for each additional language. In this project, we will work on an alternative method. The syntactic relations will be learned automatically from a text corpora with no linguistic annotation. These %22unsupervised%22 methods have recently become very popular and it turns out that, for certain types of tasks, they are better than the supervised methods. Their advantage is their simplicity and their linguistic and domain independence. We will test the induced grammar models in applications where a simple n-gram models currently outperform the syntactic ones, for example in machine translation. Our hypothesis is that the syntactic models based solely on data and not on linguistic rules can improve the machine translation results. (en)
  • Syntaktická analýza věty je jedním ze základních problémů počítačové lingvistiky. V současnosti se využívá hlavě tzv. řízených přístupů, které potřebují k naučení syntaxe daného jazyka velké množství syntakticky anotovaných korpusů (treebanků). Nevýhodou je finanční a časová náročnost vytvoření takových korpusů a potřeba pro každý další jazyk vytvářet korpus nový. V tomto projektu se budeme zabývat alternativní metodou, a to učení se syntaktických vztahů automaticky z textových korpusů bez lingvistické anotace. Tyto %22neřízené%22 metody jsou v poslední době velmi populární a ukazuje se, že pro některé typy úloh vhodnější, než metody řízené. Jejich výhodou je jednoduchost a jazyková a doménová nezávsilost. Odvozené modely gramatiky vyzkoušíme v aplikacích, ve kterých jednoduché n-gramové modely v současné době vítězí nad těmi syntaktickými. Takovou aplikací je například strojový překlad. Naše hypotéza je, že syntaktické modely založené pouze na datech a nikoli na lingvistických pravidlech mohou strojový překlad značně vylepšit.
Title
  • Sentence structure induction without annotated corpora (en)
  • Odvození větné struktury bez anotovaných korpusů
skos:notation
  • GP14-06548P
http://linked.open...avai/cep/aktivita
http://linked.open...kovaStatniPodpora
http://linked.open...ep/celkoveNaklady
http://linked.open...datumDodatniDoRIV
http://linked.open...i/cep/druhSouteze
http://linked.open...ep/duvernostUdaju
http://linked.open.../cep/fazeProjektu
http://linked.open...ai/cep/hlavniObor
http://linked.open...vai/cep/kategorie
http://linked.open.../cep/klicovaSlova
  • dependency tree, grammar induction, machine learning, unsupervised dependency parsing (en)
http://linked.open...ep/partnetrHlavni
http://linked.open...inujicichPrijemcu
http://linked.open...cep/pocetPrijemcu
http://linked.open...ocetSpoluPrijemcu
http://linked.open.../pocetVysledkuRIV
http://linked.open...enychVysledkuVRIV
http://linked.open...lneniVMinulemRoce
http://linked.open.../prideleniPodpory
http://linked.open...iciPoslednihoRoku
http://linked.open...atUdajeProjZameru
http://linked.open.../vavai/cep/soutez
http://linked.open...usZobrazovaneFaze
http://linked.open...ai/cep/typPojektu
http://linked.open...ep/ukonceniReseni
http://linked.open.../cep/vedlejsiObor
http://linked.open...ep/zahajeniReseni
http://linked.open...tniCyklusProjektu
http://linked.open.../cep/klicoveSlovo
  • grammar induction
  • machine learning
  • dependency tree
is http://linked.open...vavai/cep/projekt of
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 58 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software