About: Software module for importing data from Slovak web portals     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • Softwarový modul realizuje import dat ze slovenských webových portálů, jejich převod a filtraci z formátu HTML do čistého textu v zadaném kódování. Algoritmy pro filtraci do čistého textu jsou adaptovány na základě trénovacích dat. Natrénovaný klasifikátor každý fragment HTML stránky zařadí do jedné ze dvou tříd - čistý text článku nebo ostatní. Následně je ponechán pouze čistý text. Součástí softwarového modulu jsou i nástroj pro automatické sledování RSS kanálů. Tento nástroj usnadňuje automatizované zpracování nových dat.
  • Softwarový modul realizuje import dat ze slovenských webových portálů, jejich převod a filtraci z formátu HTML do čistého textu v zadaném kódování. Algoritmy pro filtraci do čistého textu jsou adaptovány na základě trénovacích dat. Natrénovaný klasifikátor každý fragment HTML stránky zařadí do jedné ze dvou tříd - čistý text článku nebo ostatní. Následně je ponechán pouze čistý text. Součástí softwarového modulu jsou i nástroj pro automatické sledování RSS kanálů. Tento nástroj usnadňuje automatizované zpracování nových dat. (cs)
  • The software module implements data importing algorithms tailored for Slovak web portals. It also performs the conversion and text cleaning of the source HTML page into a clean text in a given encoding. The algorithms for text cleaning are adapted using the training data. The trained classifier classifies each fragment of an HTML page into two classes - clean text of the page or %22other%22. The following post-processing algorithm keeps just the clean text. The integral part of the module is a tool for automatized downloading of RSS channels. This tool simplifies an automatized processing of new data. (en)
Title
  • Software module for importing data from Slovak web portals (en)
  • Softwarový modul pro import dat ze slovenských webových portálů
  • Softwarový modul pro import dat ze slovenských webových portálů (cs)
skos:prefLabel
  • Software module for importing data from Slovak web portals (en)
  • Softwarový modul pro import dat ze slovenských webových portálů
  • Softwarový modul pro import dat ze slovenských webových portálů (cs)
skos:notation
  • RIV/49777513:23520/12:43918029!RIV13-MSM-23520___
http://linked.open...avai/predkladatel
http://linked.open...avai/riv/aktivita
http://linked.open...avai/riv/aktivity
  • N
http://linked.open...vai/riv/dodaniDat
http://linked.open...aciTvurceVysledku
http://linked.open.../riv/druhVysledku
http://linked.open...iv/duvernostUdaju
http://linked.open...onomickeParametry
  • Výsledek vznikl na základě Smlouvy o dílo uzavřené mezi SpeechTech, s.r.o. a ZČU v Plzni dne 15.10.2012, reg. č. SML/5200/0055/12. Cena díle je 100.000 Kč. Výsledek umožňuje automatické zpracování vstupních jazykových dat za účelem tvorby jazykového modelu pro slovenštinu. Více na http://www.kky.zcu.cz/cs/sw/sk-import
http://linked.open...titaPredkladatele
http://linked.open...dnocenehoVysledku
  • 169054
http://linked.open...ai/riv/idVysledku
  • RIV/49777513:23520/12:43918029
http://linked.open...terniIdentifikace
  • SK-Import-2012
http://linked.open...riv/jazykVysledku
http://linked.open.../riv/klicovaSlova
  • language modelling; text cleaning (en)
http://linked.open.../riv/klicoveSlovo
http://linked.open...ontrolniKodProRIV
  • [9BCAA2A332FE]
http://linked.open.../licencniPoplatek
http://linked.open...in/vavai/riv/obor
http://linked.open...ichTvurcuVysledku
http://linked.open...cetTvurcuVysledku
http://linked.open...UplatneniVysledku
http://linked.open...echnickeParametry
  • Výsledek byl implementován v programovacím jazyce Python nad databázovým systémem MySQL. Pro získání licence kontaktujte: Jan Švec, Katedra kybernetiky, ZČU v Plzni, tel. 2557, více na http://www.kky.zcu.cz/cs/sw/sk-import
http://linked.open...iv/tvurceVysledku
  • Švec, Jan
  • Vavruška, Jan
http://linked.open...avai/riv/vlastnik
http://linked.open...itiJinymSubjektem
http://localhost/t...ganizacniJednotka
  • 23520
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 47 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software