About: Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy Goto Sponge NotDistinct Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

Attributes	Values
rdf:type	skos:Concept http://linked.opendata.cz/ontology/domain/vavai/Vysledek
Description	The aim of this paper is to present how a corpus can be used as a device (source) to improve the description of chosen grammatical phenomena in dictionary and grammar on one hand and in morpholigical taggers on the other hand. Two automatic morphological taggers used for tagging of Czech language corpora (Hajič, 2004 and Sedláček, 2005) will be compared. We shall analyze how three phenomena: a) synthetic future in Czech, b) comparison of adjectiv and c) word class transposition of words like hodně, mnoho, moc, are annotated in CNK and how are they described in Czech dictionaries (Slovník spisovného jazyka českého and Slovník spisovné češtiny pro školu a veřejnost) and grammars (Mluvnice češtiny, 1986, Česká mluvnice, 1989, Příruční mluvnice češtiny, 1996, Čeština, řeč a jazyk, 1996). We shall discuss how the analysis of corpus mined data can be used for detecting of gaps in examined materials and how can it contribute to filling them in. (en) Cílem našeho příspěvku je ukázat, jak mohou korpusová data přispět k doplnění popisů gramatických jevů zachycených ve slovnících a gramatikách na straně jedné a v lingvistických bázích automatických morfologických analyzátorů na straně druhé. Ke značkování řádově stamilionových korpusů se běžně používají automatické nástroje. V prostředí českých korpusů jsou to především dva analyzátory (taggery) pro morfologické značkování. Morfologický analyzátor Jana Hajiče dále HA (Hajič, 1995, 2004, http://ucnk.ff.cuni.cz/bonito/index.html) a morfologický analyzátor Radka Sedláčka Ajka (Sedláček, 2005, http://nlp.fi.muni.cz/projekty/wwwajka). Lingvistickou bázi těchto analyzátorů byly mluvnice a slovníky, o něž se opíraly algoritmické popisy flexe (Hajič 1995, Osolsobě, 1996). Při aplikaci na jazykový materiál korpusů se ukázalo, že celá řada interpretací, které byly přiřazeny jednotkám na úrovni strojových slovníků, se plně nekryje s bohatstvím přirozeného jazyka, jak je prezentuje korpus. Cílem našeho příspěvku je ukázat, jak mohou korpusová data přispět k doplnění popisů gramatických jevů zachycených ve slovnících a gramatikách na straně jedné a v lingvistických bázích automatických morfologických analyzátorů na straně druhé. Ke značkování řádově stamilionových korpusů se běžně používají automatické nástroje. V prostředí českých korpusů jsou to především dva analyzátory (taggery) pro morfologické značkování. Morfologický analyzátor Jana Hajiče dále HA (Hajič, 1995, 2004, http://ucnk.ff.cuni.cz/bonito/index.html) a morfologický analyzátor Radka Sedláčka Ajka (Sedláček, 2005, http://nlp.fi.muni.cz/projekty/wwwajka). Lingvistickou bázi těchto analyzátorů byly mluvnice a slovníky, o něž se opíraly algoritmické popisy flexe (Hajič 1995, Osolsobě, 1996). Při aplikaci na jazykový materiál korpusů se ukázalo, že celá řada interpretací, které byly přiřazeny jednotkám na úrovni strojových slovníků, se plně nekryje s bohatstvím přirozeného jazyka, jak je prezentuje korpus. (cs)
Title	Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy Corpus as Source of Amendements for Automatic Morphological Analysis (en) Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy (cs)
skos:prefLabel	Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy Corpus as Source of Amendements for Automatic Morphological Analysis (en) Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy (cs)
skos:notation	RIV/00216224:14210/07:00020828!RIV10-GA0-14210___
http://linked.open...avai/riv/aktivita	P
http://linked.open...avai/riv/aktivity	P(GV405/96/K214)
http://linked.open...vai/riv/dodaniDat	2010
http://linked.open...aciTvurceVysledku	Osolsobě, Klára
http://linked.open.../riv/druhVysledku	D - Článek ve sborníku
http://linked.open...iv/duvernostUdaju	S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
http://linked.open...titaPredkladatele	Masarykova univerzita / Filozofická fakulta
http://linked.open...dnocenehoVysledku	429851
http://linked.open...ai/riv/idVysledku	RIV/00216224:14210/07:00020828
http://linked.open...riv/jazykVysledku	cze - čeština
http://linked.open.../riv/klicovaSlova	corpus; automatical morphological analysis; verb form; word class; gradation (en)
http://linked.open.../riv/klicoveSlovo	corpus automatical morphological analysis verb form word class gradation
http://linked.open...ontrolniKodProRIV	[64B5F6CBA7FF]
http://linked.open...v/mistoKonaniAkce	Liblice
http://linked.open...i/riv/mistoVydani	Praha
http://linked.open...i/riv/nazevZdroje	Grammar & Corpora, 2nd International Conference, Abstracts
http://linked.open...in/vavai/riv/obor	AI
http://linked.open...ichTvurcuVysledku	1 (xsd:int)
http://linked.open...cetTvurcuVysledku	1 (xsd:int)
http://linked.open...vavai/riv/projekt	Czech language in the era of computers. Text corpora and lexical and grammatical base for the development of Czech in the 21 st century.
http://linked.open...UplatneniVysledku	2007
http://linked.open...iv/tvurceVysledku	Osolsobě, Klára
http://linked.open...vavai/riv/typAkce	WRD - Světová
http://linked.open.../riv/zahajeniAkce	2007-09-25 (xsd:date)
number of pages	3 (xsd:int)
http://purl.org/ne...btex#hasPublisher	Ústav pro jazyk český AV ČR
https://schema.org/isbn	80-86496-35-X
http://localhost/t...ganizacniJednotka	14210

Faceted Search & Find service v1.16.118 as of Jun 21 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 58 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software