About: Disclosure of the Czech Radio archive for sophisticated search     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • The Czech Radio archive of spoken documents is often considered one of the jewels of Czech cultural heritage. It contains the largest collection of recordings of spoken Czech, being unique in its volume (in the order of hundreds of thousands of hours of recordings), content (commentaries to daily events – both national and international) and time span (more than 80 years of continuous broadcasting). The first step in preserving the archive is the ongoing digitalization. The next step should be to utilize the latest technology and make this unique archive available to the wide public. The main aim of this project is to process the archive (especially its broadcast news part) by the methods of computer speech-text transcription, followed by the detailed indexation of the transcriptions and the creation of the database which will allow for full-text search in the archive. This will be achieved by designing and building a complex software platform that will include: an audio processing module, speech recognition and speaker recognition modules, indexation and database module, an editor of transcripts, and a web-based search and play module. The latter will allow for searching words and phrases within hundreds of thousands of hours of broadcast recordings. The search will be very fast, taking only fractions of a second. The users of this unique technology will be either Czech Radio staff (when preparing programs based on archive documents), or historians (who will be give instant and interactive access to archival sources), linguists (mainly those specialized in diachronic issues of Czech languages), and last but not least, educational institutions and the general public. The pro-ject is designed with a perspective to future sustainability, i.e. all the developed technology will be prepared to process not just the historical but also all the recent and future pro-grams, and add their content continuously to this unique multimedia archive. (en)
  • Archiv mluvených pořadů Českého rozhlasu je právem označován za jeden z klenotů kul-turního dědictví ČR.Obsahuje totiž nejrozsáhlejší sbírku záznamů mluvené češtiny, unikátní svým objemem (v řádu stovek tisíc hodin nahrávek), obsahem (dennodenní komentáře k domácím i světovým událostem) i časovým rozpětím (více než 80 let nepřetržitého vysílání). Prvním krokem záchrany tohoto archivu je právě probíhající digitalizace. Druhým krokem by mělo být jeho zpřístupnění pomocí nejmodernějších technologií. To je cílem to-hoto projektu, jehož výsledkem bude zpracování významné části archivu (zejména zpra-vodajských a publicistických pořadů) metodami počítačového přepisu řeči, uložení těchto přepisů doplněných o řadu detailních informací do databáze a umožnění neomezeného vyhledávání v této databázi způsobem obdobným jako u textových dokumentů (tzv. full-text search). Vytvořením komplexní softwarové technologie, zahrnující moduly zpracování audiosignálu archivních nahrávek, rozpoznávání řeči a řečníka, zaindexování přepisů do databáze, editoru a webového přehrávače, vznikne veřejně přístupný portál, který umožní nalezení libovolného slova či slovního spojení v archivu obsahujícím až stovky tisíc hodin záznamů, a to během zlomku sekundy. Uživateli této unikátní technologie budou jak pra-covníci Českého rozhlasu, jimž významným způsobem usnadní redakční práci, tak i histo-rici, kteří tímto způsobem získají okamžitý a interaktivní přístup k archivním pramenům, jazykovědci, pro něž bude takto zpřístupněný archiv zdrojem pro studie týkající se vývoje různých aspektů českého jazyka za posledních 80 let, a v neposlední řadě i vzdělávací instituce a široká veřejnost. Projekt je navržen s ohledem na budoucí udržitelnost, tj. vyvi-nuté technologie budou připraveny stejným způsobem zpracovávat všechny současné i budoucí pořady a průběžně tak doplňovat a aktualizovat obsah tohoto unikátního multime-diálního archivu.
Title
  • Disclosure of the Czech Radio archive for sophisticated search (en)
  • Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání
skos:notation
  • DF11P01OVV013
http://linked.open...avai/cep/aktivita
http://linked.open...kovaStatniPodpora
http://linked.open...ep/celkoveNaklady
http://linked.open...datumDodatniDoRIV
http://linked.open...i/cep/druhSouteze
http://linked.open...ep/duvernostUdaju
http://linked.open.../cep/fazeProjektu
http://linked.open...ai/cep/hlavniObor
http://linked.open...vai/cep/kategorie
http://linked.open.../cep/klicovaSlova
  • Audio archive processing; multimedia database; speech recognition; document indexation; full-text search; oral memory heritage (en)
http://linked.open...ep/partnetrHlavni
http://linked.open...inujicichPrijemcu
http://linked.open...cep/pocetPrijemcu
http://linked.open...ocetSpoluPrijemcu
http://linked.open.../pocetVysledkuRIV
http://linked.open...enychVysledkuVRIV
http://linked.open...lneniVMinulemRoce
http://linked.open.../prideleniPodpory
http://linked.open...iciPoslednihoRoku
http://linked.open...atUdajeProjZameru
http://linked.open.../vavai/cep/soutez
http://linked.open...usZobrazovaneFaze
http://linked.open...ai/cep/typPojektu
http://linked.open...ep/ukonceniReseni
http://linked.open.../cep/vedlejsiObor
http://linked.open...ep/zahajeniReseni
http://linked.open...tniCyklusProjektu
http://linked.open.../cep/klicoveSlovo
  • document indexation
  • full-text search
  • multimedia database
  • speech recognition
  • Audio archive processing
is http://linked.open...vavai/cep/projekt of
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 58 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software