About: ASR- and MT-based Access to a Large Archive of Cultural Heritage (AMALACH)     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • The objective of the project is build software tools for end-user access to a large videoarchive of Holocaust survivors testimonies. This archive, created in the 1990s and currently maintained by the Visual History Institute (Shoa Foundation Institute) at the University of Southern California (USC, http://dornsife.usc.edu/vhi). The archive is currently accessible only at the MFF UK building in Prague and two more places in Europee. It contains more than 110 thousand hours of interview in 32 languages, about half of them in English. There are about 1,000 hours of testimonies recorded in Czech. Searching such a large videoarchive is thus very difficult without proper search software. At present, thesaurus-only keyword search based on sparse, manually created index is possible. The situation is even worse for non-English testimonies, such as those recorded in Czech. Our goal is thus to combine and apply advanced continuous speech recognition, speech retrieval and machine translation methods to allow for a precise, fast and targeted search in the USC archive s (at least) Czech and English testimonies, in a cross-lingual manner; Slovak (another 1000 hours) will be added if possible. The cross-lingual capability over the English testimonies will make it possible for Czech users to access in a unified way the additional 4000 testimonies given by Czechs but recorded in English, and there are another 12 thousand where the Czech territory, historical events related to former Czechoslovakia and people from the region are mentioned. (en)
  • Hlavním cílem navrhovaného projektu je výzkum a vývoj softwarových nástrojů pro zpřístupnění rozsáhlého videoarchivu obsahujícího svědectví lidí, kteří přežili holokaust. Tento archiv, vytvořený v 90. letech 20. století a spravovaný v současné době USC (University of Southern California) Shoah Foundation Institute (http://dornsife.usc.edu/vhi), obsahuje více než 110 tisíc hodin záznamů v 32 jazycích, přičemž přibližně polovina těchto rozhovorů je vedena v angličtině. Česká část archivu obnáší zhruba jeden tisíc hodin. Orientace v archivu bez použití dobře fungujícího vyhledávacího softwaru je tudíž velmi obtížná. V současné době je možno v archivu, který je v Česku přístupný zatím na MFF UK v Praze, vyhledávat pomocí klíčových slov vybíraných ze speciálního slovníku (tezauru), která byla manuálně přiřazena jednotlivým pasážím. Pokrytí archivu těmito klíčovými slovy je ovšem nedostatečné, především v případě českých výpovědí. Naším cílem je proto využít pokročilé metody rozpoznávání souvislé řeči, automatického vyhledávání informací a strojového překladu k tomu, abychom vyvinuli efektivně fungující systém schopný rychle a kvalitně (tj. přesně) vyhledávat zadané dotazy (přinejmenším) v česky a anglicky mluvených výpovědích zmíněného archivu. Podle konkrétního postupu a kapacit projektu bude případně možno začlenit v omezeném rozsahu i slovenštinu, ve které je nahráno dalších cca 1000h výpovědí. Začlenění angličtiny (a slovenštiny) jako dalších jazyků není samoúčelné: lidí, kteří v osudné době žili v Česku (Československu), ale výpověď uloženou v archívu poskytli v angličtině (např. z důvodu dlouhého poválečného pobytu v cizině), jsou další téměř čtyři tisíce. O osudech přeživších z Česka (Československa) navíc mluví i řada dalších přeživších (archív obsahuje celkem 12 tisíc výpovědí, kde se mluví v nějaké formě o bývalém Československu).
Title
  • ASR- and MT-based Access to a Large Archive of Cultural Heritage (AMALACH) (en)
  • Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)
skos:notation
  • DF12P01OVV022
http://linked.open...avai/cep/aktivita
http://linked.open...kovaStatniPodpora
http://linked.open...ep/celkoveNaklady
http://linked.open...datumDodatniDoRIV
http://linked.open...i/cep/druhSouteze
http://linked.open...ep/duvernostUdaju
http://linked.open.../cep/fazeProjektu
http://linked.open...ai/cep/hlavniObor
http://linked.open...vai/cep/kategorie
http://linked.open.../cep/klicovaSlova
  • Cultural heritage; history; World War II; audioarchive; videoarchive; Holocaust; oral history; speech recognition; speech retrieval; machine translation; Czech language processing; English language processing; cross-lingual search (en)
http://linked.open...ep/partnetrHlavni
http://linked.open...inujicichPrijemcu
http://linked.open...cep/pocetPrijemcu
http://linked.open...ocetSpoluPrijemcu
http://linked.open.../pocetVysledkuRIV
http://linked.open...enychVysledkuVRIV
http://linked.open...lneniVMinulemRoce
http://linked.open.../prideleniPodpory
http://linked.open...iciPoslednihoRoku
http://linked.open...atUdajeProjZameru
http://linked.open.../vavai/cep/soutez
http://linked.open...usZobrazovaneFaze
http://linked.open...ai/cep/typPojektu
http://linked.open...ep/ukonceniReseni
http://linked.open.../cep/vedlejsiObor
http://linked.open...ep/zahajeniReseni
http://linked.open...tniCyklusProjektu
http://linked.open.../cep/klicoveSlovo
  • Cultural heritage
  • Czech language processing
  • English language processing
  • Holocaust
  • World War II
  • audioarchive
  • history
  • machine translation
  • oral history
  • speech recognition
  • speech retrieval
  • videoarchive
is http://linked.open...vavai/cep/projekt of
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 84 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software