About: Aspects of digitization: The reading order in digitized old newspapers     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • The issue of the newspaper is filled with diverse information associated to the articles, which are supplemented by photographs or images and surrounded by advertisments. Newspaper page contains a number of references and graphic elements that intuitively guides the reader to continuation of the article or illustration. Digitized image preserves the layout of the page but thanks to new technologies and metadata formats such as METS and ALTO we can go into more depth and extract information from newspapers at the level of articles. This requires newspapers digitally %22reshape%22 to the individual zones and then create a logical structure that can be presented together as a separate document, although an article in the paper version is surrounded by other articles and contained in a several pages. Experts in the Czech Republic created a specification of METS and ALTO format profiles that contains the logical structure of newspapers, their binding to the fulltext and the reading order of the segments forming the article. Experts from the Library of Congress, which manages most of library metadata standards including METS and ALTO, are interested in our solution. Now we are working on the official METS profile. (en)
  • Výtisk novin je zaplněn různorodými informacemi sdruženými do článků, které jsou doplněny fotografiemi či obrázky a obklopeny reklamními sděleními. Jednotlivé stránky obsahují množství odkazů a grafických prvků, které čtenáře intuitivně navádějí k pokračování článku či příslušné ilustraci. Při digitalizaci je zachycen obraz strany, který toto rozvržení zachovává, ale díky novým technologiím a metadatovým formátům jako METS a ALTO je možné jít více do hloubky a extrahovat z novin informace na úrovni článků. To vyžaduje noviny digitálně “rozstříhat” na jednotlivé zóny a ty potom logicky provázat tak, že mohou být prezentovány sdruženě jako samostatný dokument, přestože článek v papírové verzi je obklopen dalšími články a vytištěn na několika stranách. Odborníky v ČR byla vytvořena specifikace profilů formátů METS a ALTO, která řeší logickou strukturu novin, jejich navázání na plný text včetně pořadí čtení jednotlivých segmentů tvořících článek. Tato specifikace zaujala i odborníky z Library of Congress, která je správcem většiny knihovnických metadatových standardů včetně standardů METS a ALTO. V současnosti se pracuje na oficiálním METS profilu.
  • Výtisk novin je zaplněn různorodými informacemi sdruženými do článků, které jsou doplněny fotografiemi či obrázky a obklopeny reklamními sděleními. Jednotlivé stránky obsahují množství odkazů a grafických prvků, které čtenáře intuitivně navádějí k pokračování článku či příslušné ilustraci. Při digitalizaci je zachycen obraz strany, který toto rozvržení zachovává, ale díky novým technologiím a metadatovým formátům jako METS a ALTO je možné jít více do hloubky a extrahovat z novin informace na úrovni článků. To vyžaduje noviny digitálně “rozstříhat” na jednotlivé zóny a ty potom logicky provázat tak, že mohou být prezentovány sdruženě jako samostatný dokument, přestože článek v papírové verzi je obklopen dalšími články a vytištěn na několika stranách. Odborníky v ČR byla vytvořena specifikace profilů formátů METS a ALTO, která řeší logickou strukturu novin, jejich navázání na plný text včetně pořadí čtení jednotlivých segmentů tvořících článek. Tato specifikace zaujala i odborníky z Library of Congress, která je správcem většiny knihovnických metadatových standardů včetně standardů METS a ALTO. V současnosti se pracuje na oficiálním METS profilu. (cs)
Title
  • Aspects of digitization: The reading order in digitized old newspapers (en)
  • Aspekty digitalizace: pořadí čtení článků v digitalizovaných starých novinách
  • Aspekty digitalizace: pořadí čtení článků v digitalizovaných starých novinách (cs)
skos:prefLabel
  • Aspects of digitization: The reading order in digitized old newspapers (en)
  • Aspekty digitalizace: pořadí čtení článků v digitalizovaných starých novinách
  • Aspekty digitalizace: pořadí čtení článků v digitalizovaných starých novinách (cs)
skos:notation
  • RIV/00094943:_____/13:#0000158!RIV14-MK0-00094943
http://linked.open...avai/riv/aktivita
http://linked.open...avai/riv/aktivity
  • V
http://linked.open...vai/riv/dodaniDat
http://linked.open...aciTvurceVysledku
http://linked.open.../riv/druhVysledku
http://linked.open...iv/duvernostUdaju
http://linked.open...titaPredkladatele
http://linked.open...dnocenehoVysledku
  • 62189
http://linked.open...ai/riv/idVysledku
  • RIV/00094943:_____/13:#0000158
http://linked.open...riv/jazykVysledku
http://linked.open.../riv/klicovaSlova
  • OCR, METS, metadata, digitization of old newspapers, ALTO (en)
http://linked.open.../riv/klicoveSlovo
http://linked.open...ontrolniKodProRIV
  • [F09DB99C4361]
http://linked.open...in/vavai/riv/obor
http://linked.open...ichTvurcuVysledku
http://linked.open...cetTvurcuVysledku
http://linked.open...UplatneniVysledku
http://linked.open...iv/tvurceVysledku
  • Švástová, Pavla
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 110 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software