Attributes | Values |
---|
rdf:type
| |
Description
| - EGOTHOR je vyhledávací stroj indexující web a umožňující hledat webovské dokumenty. Jím dodávaný seznam hitů obsahuje, URL a název hitu, a také snippet snažící se stručně ukázat shodu. Snippet může být téměř vždy vytvořen algoritmem, který úplnou zanlost původního dokumentu (většinou HTML stránky). Z toho plyne, že vyhledávací stroj si musí jako součást indexu uchovávat ke všem dokumentům jejich plné znění. Takovýto požadavek nás vede k odpovídajícím kompresním algoritmům, které umožní zredukovat nároky na místo. Jedním z řešení je použít stávající běžně dostupné metody jako je gzip či bzip2, ale může být výhodnější vyvinout novou metodu, která by mohla využít strukturu dokumentu či textový charakter těch dokumentů. Pro kompresi XML dokumentů již existují specializované kompresní metody. Cílem tohoto příspěvku je integrace těchto dvou přístupů k dosažení optimálního kompresního poměru. (cs)
- EGOTHOR is a search engine that indexes the Web and allows us to search the Web documents. Its hit list contains URL and title of the hits, and also some snippet which tries to shortly show a match. The snippet can be almost always assembled by an algorithm that has a full knowledge of the original document (mostly HTML page). It implies that the search engine is required to store the full text of the documents as part of the index. Such a requirement leads us to an appropriate compression algorithm which would reduce the space demand. One of the solutions could be some use of common compression methods, for instance gzip or bzip2, but it might be preferable to develop a new method which would take advantage of the document structure, or rather, the textual character of the documents. There already exist special compression text algorithms and methods for a compression of XML documents. The aim of this paper is an integration of the two approaches to achieve an optimal level of the compression ratio
- EGOTHOR is a search engine that indexes the Web and allows us to search the Web documents. Its hit list contains URL and title of the hits, and also some snippet which tries to shortly show a match. The snippet can be almost always assembled by an algorithm that has a full knowledge of the original document (mostly HTML page). It implies that the search engine is required to store the full text of the documents as part of the index. Such a requirement leads us to an appropriate compression algorithm which would reduce the space demand. One of the solutions could be some use of common compression methods, for instance gzip or bzip2, but it might be preferable to develop a new method which would take advantage of the document structure, or rather, the textual character of the documents. There already exist special compression text algorithms and methods for a compression of XML documents. The aim of this paper is an integration of the two approaches to achieve an optimal level of the compression ratio (en)
|
Title
| - Compression of Semistructured Documents
- Compression of Semistructured Documents (en)
- Komprese semistrukturovaných dokumentů (cs)
|
skos:prefLabel
| - Compression of Semistructured Documents
- Compression of Semistructured Documents (en)
- Komprese semistrukturovaných dokumentů (cs)
|
skos:notation
| - RIV/00216208:11320/07:00005175!RIV08-AV0-11320___
|
http://linked.open.../vavai/riv/strany
| |
http://linked.open...avai/riv/aktivita
| |
http://linked.open...avai/riv/aktivity
| - P(1ET100300419), P(1ET100300517), Z(MSM0021620838)
|
http://linked.open...iv/cisloPeriodika
| |
http://linked.open...vai/riv/dodaniDat
| |
http://linked.open...aciTvurceVysledku
| |
http://linked.open.../riv/druhVysledku
| |
http://linked.open...iv/duvernostUdaju
| |
http://linked.open...titaPredkladatele
| |
http://linked.open...dnocenehoVysledku
| |
http://linked.open...ai/riv/idVysledku
| - RIV/00216208:11320/07:00005175
|
http://linked.open...riv/jazykVysledku
| |
http://linked.open.../riv/klicovaSlova
| - Compression; Semistructured; Documents (en)
|
http://linked.open.../riv/klicoveSlovo
| |
http://linked.open...odStatuVydavatele
| - GB - Spojené království Velké Británie a Severního Irska
|
http://linked.open...ontrolniKodProRIV
| |
http://linked.open...i/riv/nazevZdroje
| - International Journal of Information Technology
|
http://linked.open...in/vavai/riv/obor
| |
http://linked.open...ichTvurcuVysledku
| |
http://linked.open...cetTvurcuVysledku
| |
http://linked.open...vavai/riv/projekt
| |
http://linked.open...UplatneniVysledku
| |
http://linked.open...v/svazekPeriodika
| |
http://linked.open...iv/tvurceVysledku
| - Žemlička, Michal
- Lánský, Jan
- Galamboš, Leo
|
http://linked.open...n/vavai/riv/zamer
| |
issn
| |
number of pages
| |
http://localhost/t...ganizacniJednotka
| |
is http://linked.open...avai/riv/vysledek
of | |