About: Extrakce N-gramů z rozsáhlých textů

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Extrakce N-gramů z rozsáhlých textů Goto Sponge NotDistinct Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

Attributes	Values
rdf:type	skos:Concept http://linked.opendata.cz/ontology/domain/vavai/Vysledek
Description	V úlohách zpracování přirozeného jazyka jsou k reprezentaci textových dokumentů nejčastěji používána jednotlivá slova. Celkové výsledky lze však často vylepšit použitím dalších, sofistikovanějších položek. Mezi ně patří i N-gramy, pro jejichž extrakci byly publikovány algoritmy založené na různých principech. Existující techniky však nejsou primárně určeny pro zpracování velkého objemu dat, což je v současné době zásadní požadavek. V tomto článku prezentujeme lagoritmus pro exttrakci N-gramů z rozsáhlých textových korpusů. Srovnání s jinými přístupy naznačují, že naše řešení dosahuje výrazně lepších výsledků s ohledem na čas a množství zpracovaných dat. V úlohách zpracování přirozeného jazyka jsou k reprezentaci textových dokumentů nejčastěji používána jednotlivá slova. Celkové výsledky lze však často vylepšit použitím dalších, sofistikovanějších položek. Mezi ně patří i N-gramy, pro jejichž extrakci byly publikovány algoritmy založené na různých principech. Existující techniky však nejsou primárně určeny pro zpracování velkého objemu dat, což je v současné době zásadní požadavek. V tomto článku prezentujeme lagoritmus pro exttrakci N-gramů z rozsáhlých textových korpusů. Srovnání s jinými přístupy naznačují, že naše řešení dosahuje výrazně lepších výsledků s ohledem na čas a množství zpracovaných dat. (cs) In this paper, we present an algotihm for N-gram extraction from large datasets. To examine the overall time and memory complexities of our algorithm we employed the %22Web 1T 5-gram Version 1%22 corpus released by Google. The experiments indicate that our approach reaches outstanding results among other available solutions in terms of speed and amount of processed data. (en)
Title	Extrakce N-gramů z rozsáhlých textů Extrakce N-gramů z rozsáhlých textů (cs) N-gram Extraction from Large Datasets (en)
skos:prefLabel	Extrakce N-gramů z rozsáhlých textů Extrakce N-gramů z rozsáhlých textů (cs) N-gram Extraction from Large Datasets (en)
skos:notation	RIV/49777513:23520/08:00500256!RIV09-MSM-23520___
http://linked.open...avai/riv/aktivita	P
http://linked.open...avai/riv/aktivity	P(2C06009)
http://linked.open...vai/riv/dodaniDat	2009
http://linked.open...aciTvurceVysledku	Hanák, Ivo Tesař, Roman Češka, Zdeněk
http://linked.open.../riv/druhVysledku	D - Článek ve sborníku
http://linked.open...iv/duvernostUdaju	S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
http://linked.open...titaPredkladatele	Západočeská univerzita v Plzni / Fakulta aplikovaných věd
http://linked.open...dnocenehoVysledku	367504
http://linked.open...ai/riv/idVysledku	RIV/49777513:23520/08:00500256
http://linked.open...riv/jazykVysledku	cze - čeština
http://linked.open.../riv/klicovaSlova	large datasets; batch processing; N-gram extraction (en)
http://linked.open.../riv/klicoveSlovo	large datasets batch processing N-gram extraction
http://linked.open...ontrolniKodProRIV	[98E9FB1CF2D2]
http://linked.open...v/mistoKonaniAkce	Bratislava
http://linked.open...i/riv/mistoVydani	Bratislava
http://linked.open...i/riv/nazevZdroje	Znalosti 2008
http://linked.open...in/vavai/riv/obor	JC
http://linked.open...ichTvurcuVysledku	3 (xsd:int)
http://linked.open...cetTvurcuVysledku	3 (xsd:int)
http://linked.open...vavai/riv/projekt	Complex knowledge base tools for natural language communication with the semantic web
http://linked.open...UplatneniVysledku	2008
http://linked.open...iv/tvurceVysledku	Tesař, Roman Hanák, Ivo Češka, Zdeněk
http://linked.open...vavai/riv/typAkce	EUR - Evropská
http://linked.open.../riv/zahajeniAkce	2008-02-15 (xsd:date)
number of pages	12 (xsd:int)
http://purl.org/ne...btex#hasPublisher	Slovenská technická univerzita v Bratislave. Vydavateľstvo STU
https://schema.org/isbn	978-80-227-2827-0
http://localhost/t...ganizacniJednotka	23520
is http://linked.open...avai/riv/vysledek of	Extrakce N-gramů z rozsáhlých textů Extrakce N-gramů z rozsáhlých textů Extrakce N-gramů z rozsáhlých textů Extrakce N-gramů z rozsáhlých textů

Faceted Search & Find service v1.16.118 as of Jun 21 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 58 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software