About: PARSEME: Parsing a víceslovné výrazy - k jazykovědné přesnosti a výpočetní efektivitě ve zpracování přirozeného jazyka     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • The goal of the proposed project follows from the overall aim of the whole COST Action IC1207. This Action aims at increasing and enhancing the support of the European multilingual heritage from Information and Communication Technologies (ICT). This general aim is addressed through improving linguistic representativeness, precision and computational efficiency of Natural Language Processing (NLP) applications. The Action focuses on the major bottleneck of these applications: Multi-Word Expressions (MWEs), i.e. sequences of words with unpredictable properties such as to count somebody in or to take a haircut. A breakthrough in their modeling and processing can only result from a coordinated effort of multidisciplinary experts in different languages. COST is the most adequate framework answering this need. Fourteen European languages will be addressed from a cross-theoretical and cross-methodological perspective, necessary for coping with current fragmentation issues. Expected deliverables include enhanced language resources and tools, as well as recommendations of best practices for cutting-edge MWE-aware language models. The Action will lead to a better understanding of the nature of MWEs. It will establish a long-lasting collaboration within a multilingual network of MWE specialists. It will pave the way towards competitive next generation text processing tools which will pay greater attention to language phenomena. Specifically, the proposed project will concentrate on the specification of MWE annotation over a large corpus (while, naturally, focusing on the Czech language), annotation of Czech corpus and MWE extraction in the form of an electronic dictionary formatted for future NLP applications. Our goal is to publish all electronic language resources in an open way (using the CC license) for open access in future research as well as applications. (en)
  • Cílem projektu je ve spolupráci se zahraničními partnery a s využitím jejich zkušeností významně posílit vlastní výzkum v oblasti zpracování přirozeného jazyka, konkrétně v oblasti analýzy víceslovných výrazů (multiword entities, MWE), a to z hlediska tvaroslovného, syntaktického a zejména významového. Tento cíl má několik postupných (pod)cílů: metodologii výzkumu v této specifické oblasti ze začleněním dosud rozdrobených poznatků mezinárodního konsorcia partnerů, přípravu expertních lingvisticky anotovaných dat (textových korpusů analyzovaných z hlediska MWE), extrakci slovníku MWE z takto připravených dat, a přípravu pilotních experimentů identifikace MWE v textu. Vedlejším, nicméně velmi důležitým cílem z hlediska navazujícího výzkumu je příprava veřejně dostupných anotovaných dat a již zmíněného slovníku ve formátu vhodném pro další zkoumání a navazující metody strojového učení.
Title
  • PARSEME: Parsing a víceslovné výrazy - k jazykovědné přesnosti a výpočetní efektivitě ve zpracování přirozeného jazyka
  • Parsing and multi-word expressions. Towards linguistic precision and computational efficiency in natural language processing (PARSEME) (en)
skos:notation
  • LD14117
http://linked.open...avai/cep/aktivita
http://linked.open...kovaStatniPodpora
http://linked.open...ep/celkoveNaklady
http://linked.open...datumDodatniDoRIV
http://linked.open...i/cep/druhSouteze
http://linked.open...ep/duvernostUdaju
http://linked.open.../cep/fazeProjektu
http://linked.open...ai/cep/hlavniObor
http://linked.open...vai/cep/kategorie
http://linked.open.../cep/klicovaSlova
  • Natural language processing, Czech language, multiword entities, parsing, analysis, corpus, dictionary, language resources, language annotation, morphology, syntax, semantics, meaning (en)
http://linked.open...ep/partnetrHlavni
http://linked.open...inujicichPrijemcu
http://linked.open...cep/pocetPrijemcu
http://linked.open...ocetSpoluPrijemcu
http://linked.open.../pocetVysledkuRIV
http://linked.open...enychVysledkuVRIV
http://linked.open...lneniVMinulemRoce
http://linked.open.../prideleniPodpory
http://linked.open...iciPoslednihoRoku
http://linked.open...atUdajeProjZameru
http://linked.open.../vavai/cep/soutez
http://linked.open...usZobrazovaneFaze
http://linked.open...ai/cep/typPojektu
http://linked.open...ep/ukonceniReseni
http://linked.open.../cep/vedlejsiObor
http://linked.open...ep/zahajeniReseni
http://linked.open...tniCyklusProjektu
http://linked.open.../cep/klicoveSlovo
  • Natural language processing
  • Czech language
  • analysis
  • corpus
  • dictionary
  • morphology
  • parsing
  • semantics
  • syntax
  • language annotation
  • language resources
  • multiword entities
is http://linked.open...vavai/cep/projekt of
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 26 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software