About: Využití techniky náhodného indexování v oblasti detekce plagiátů

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Využití techniky náhodného indexování v oblasti detekce plagiátů Goto Sponge NotDistinct Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

Attributes	Values
rdf:type	skos:Concept http://linked.opendata.cz/ontology/domain/vavai/Vysledek
Description	Plagiarism is a wide spread problem that is of great interest these days because of the ease with which electronic documents can be copied. This paper extends the idea of the Latent Semantic Analysis (LSA) application in the field of plagiarism detection and proposes new improvements. The main subject of this paper is the application of a feature compression technique to overcome the problem of processing large amounts of data. Another issue to be discussed is document similarity normalization. A Czech corpus of 1,500 text documents about politics was employed for the experiments. This corpus included documents that had been manually plagiarized by students. The results indicate that the proposed compression technique is able to essentially decrease time execution requirements. Moreover, it has been proved that the new proposed document similarity normalization formula increases the accuracy of plagiarism detection. (en) Rostoucí snaha plagiovat cizí práce, především v oblasti školství, zapříčinila vývoj nových a lepších metod, které by těmto intrikám čelily. Tento článek rozvíjí myšlenku aplikace Latentní sémantické analýzy (LSA) v oblasti detekce plagiátů a navrhuje nová vylepšení. Hlavním diskutovaným předmětem je aplikace kompresní techniky tzv. náhodného indexování, která transformuje data do alternativního zmenšeného prostoru. Kromě toho se článek zabývá normalizací podobností mezi dokumenty a přináší novou asymetrickou normalizační formuli. Experimenty byly provedeny na manuálně vytvořeném korpusu českých plagiátů, který obsahuje 1500 dokumentů o politice. Dosažené výsledky indikují, že kompresní technika dokáže významně snížit časové požadavky pro LSA. Aplikací nové normalizační formule lze navíc dosáhnout i vyšší přesnosti detekce plagiátů při současně nižších časových požadavcích. Rostoucí snaha plagiovat cizí práce, především v oblasti školství, zapříčinila vývoj nových a lepších metod, které by těmto intrikám čelily. Tento článek rozvíjí myšlenku aplikace Latentní sémantické analýzy (LSA) v oblasti detekce plagiátů a navrhuje nová vylepšení. Hlavním diskutovaným předmětem je aplikace kompresní techniky tzv. náhodného indexování, která transformuje data do alternativního zmenšeného prostoru. Kromě toho se článek zabývá normalizací podobností mezi dokumenty a přináší novou asymetrickou normalizační formuli. Experimenty byly provedeny na manuálně vytvořeném korpusu českých plagiátů, který obsahuje 1500 dokumentů o politice. Dosažené výsledky indikují, že kompresní technika dokáže významně snížit časové požadavky pro LSA. Aplikací nové normalizační formule lze navíc dosáhnout i vyšší přesnosti detekce plagiátů při současně nižších časových požadavcích. (cs)
Title	Využití techniky náhodného indexování v oblasti detekce plagiátů The Use of Random Indexing in the Field of Plagiarism Detection (en) Využití techniky náhodného indexování v oblasti detekce plagiátů (cs)
skos:prefLabel	Využití techniky náhodného indexování v oblasti detekce plagiátů The Use of Random Indexing in the Field of Plagiarism Detection (en) Využití techniky náhodného indexování v oblasti detekce plagiátů (cs)
skos:notation	RIV/49777513:23520/09:00502260!RIV10-MSM-23520___
http://linked.open...avai/riv/aktivita	P
http://linked.open...avai/riv/aktivity	P(2C06009)
http://linked.open...vai/riv/dodaniDat	2010
http://linked.open...aciTvurceVysledku	Češka, Zdeněk
http://linked.open.../riv/druhVysledku	D - Článek ve sborníku
http://linked.open...iv/duvernostUdaju	S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
http://linked.open...titaPredkladatele	Západočeská univerzita v Plzni / Fakulta aplikovaných věd
http://linked.open...dnocenehoVysledku	351023
http://linked.open...ai/riv/idVysledku	RIV/49777513:23520/09:00502260
http://linked.open...riv/jazykVysledku	cze - čeština
http://linked.open.../riv/klicovaSlova	Plagiarism; Copy Detection; Comparison; Random Indexing; Feature Compression; Latent Semantic Analysis; Singular Value Decomposition (en)
http://linked.open.../riv/klicoveSlovo	Plagiarism Random Indexing Comparison Latent Semantic Analysis Singular Value Decomposition Copy Detection Feature Compression
http://linked.open...ontrolniKodProRIV	[BDB54829AED1]
http://linked.open...v/mistoKonaniAkce	Králova studňa
http://linked.open...i/riv/mistoVydani	Seňa
http://linked.open...i/riv/nazevZdroje	Informačné Technológie - Aplikácie a Teória
http://linked.open...in/vavai/riv/obor	JC
http://linked.open...ichTvurcuVysledku	1 (xsd:int)
http://linked.open...cetTvurcuVysledku	1 (xsd:int)
http://linked.open...vavai/riv/projekt	Complex knowledge base tools for natural language communication with the semantic web
http://linked.open...UplatneniVysledku	2009
http://linked.open...iv/tvurceVysledku	Češka, Zdeněk
http://linked.open...vavai/riv/typAkce	EUR - Evropská
http://linked.open.../riv/zahajeniAkce	2009-09-29 (xsd:date)
number of pages	4 (xsd:int)
http://purl.org/ne...btex#hasPublisher	PONT s.r.o.
https://schema.org/isbn	978-80-970179-1-0
http://localhost/t...ganizacniJednotka	23520
is http://linked.open...avai/riv/vysledek of	Využití techniky náhodného indexování v oblasti detekce plagiátů Využití techniky náhodného indexování v oblasti detekce plagiátů Využití techniky náhodného indexování v oblasti detekce plagiátů Využití techniky náhodného indexování v oblasti detekce plagiátů

Faceted Search & Find service v1.16.118 as of Jun 21 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 58 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software