Attributes | Values |
---|
rdf:type
| |
rdfs:seeAlso
| |
Description
| - The objective of the project is build software tools for end-user access to a large videoarchive of Holocaust survivors testimonies. This archive, created in the 1990s and currently maintained by the Visual History Institute (Shoa Foundation Institute) at the University of Southern California (USC, http://dornsife.usc.edu/vhi). The archive is currently accessible only at the MFF UK building in Prague and two more places in Europee. It contains more than 110 thousand hours of interview in 32 languages, about half of them in English. There are about 1,000 hours of testimonies recorded in Czech. Searching such a large videoarchive is thus very difficult without proper search software. At present, thesaurus-only keyword search based on sparse, manually created index is possible. The situation is even worse for non-English testimonies, such as those recorded in Czech. Our goal is thus to combine and apply advanced continuous speech recognition, speech retrieval and machine translation methods to allow for a precise, fast and targeted search in the USC archive s (at least) Czech and English testimonies, in a cross-lingual manner; Slovak (another 1000 hours) will be added if possible. The cross-lingual capability over the English testimonies will make it possible for Czech users to access in a unified way the additional 4000 testimonies given by Czechs but recorded in English, and there are another 12 thousand where the Czech territory, historical events related to former Czechoslovakia and people from the region are mentioned. (en)
- Hlavním cílem navrhovaného projektu je výzkum a vývoj softwarových nástrojů pro zpřístupnění rozsáhlého videoarchivu obsahujícího svědectví lidí, kteří přežili holokaust. Tento archiv, vytvořený v 90. letech 20. století a spravovaný v současné době USC (University of Southern California) Shoah Foundation Institute (http://dornsife.usc.edu/vhi), obsahuje více než 110 tisíc hodin záznamů v 32 jazycích, přičemž přibližně polovina těchto rozhovorů je vedena v angličtině. Česká část archivu obnáší zhruba jeden tisíc hodin. Orientace v archivu bez použití dobře fungujícího vyhledávacího softwaru je tudíž velmi obtížná. V současné době je možno v archivu, který je v Česku přístupný zatím na MFF UK v Praze, vyhledávat pomocí klíčových slov vybíraných ze speciálního slovníku (tezauru), která byla manuálně přiřazena jednotlivým pasážím. Pokrytí archivu těmito klíčovými slovy je ovšem nedostatečné, především v případě českých výpovědí. Naším cílem je proto využít pokročilé metody rozpoznávání souvislé řeči, automatického vyhledávání informací a strojového překladu k tomu, abychom vyvinuli efektivně fungující systém schopný rychle a kvalitně (tj. přesně) vyhledávat zadané dotazy (přinejmenším) v česky a anglicky mluvených výpovědích zmíněného archivu. Podle konkrétního postupu a kapacit projektu bude případně možno začlenit v omezeném rozsahu i slovenštinu, ve které je nahráno dalších cca 1000h výpovědí. Začlenění angličtiny (a slovenštiny) jako dalších jazyků není samoúčelné: lidí, kteří v osudné době žili v Česku (Československu), ale výpověď uloženou v archívu poskytli v angličtině (např. z důvodu dlouhého poválečného pobytu v cizině), jsou další téměř čtyři tisíce. O osudech přeživších z Česka (Československa) navíc mluví i řada dalších přeživších (archív obsahuje celkem 12 tisíc výpovědí, kde se mluví v nějaké formě o bývalém Československu).
|
Title
| - ASR- and MT-based Access to a Large Archive of Cultural Heritage (AMALACH) (en)
- Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)
|
skos:notation
| |
http://linked.open...avai/cep/aktivita
| |
http://linked.open...kovaStatniPodpora
| |
http://linked.open...ep/celkoveNaklady
| |
http://linked.open...datumDodatniDoRIV
| |
http://linked.open...i/cep/druhSouteze
| |
http://linked.open...ep/duvernostUdaju
| |
http://linked.open.../cep/fazeProjektu
| |
http://linked.open...ai/cep/hlavniObor
| |
http://linked.open...vai/cep/kategorie
| |
http://linked.open.../cep/klicovaSlova
| - Cultural heritage; history; World War II; audioarchive; videoarchive; Holocaust; oral history; speech recognition; speech retrieval; machine translation; Czech language processing; English language processing; cross-lingual search (en)
|
http://linked.open...ep/partnetrHlavni
| |
http://linked.open...inujicichPrijemcu
| |
http://linked.open...cep/pocetPrijemcu
| |
http://linked.open...ocetSpoluPrijemcu
| |
http://linked.open.../pocetVysledkuRIV
| |
http://linked.open...enychVysledkuVRIV
| |
http://linked.open...lneniVMinulemRoce
| |
http://linked.open.../prideleniPodpory
| |
http://linked.open...iciPoslednihoRoku
| |
http://linked.open...atUdajeProjZameru
| |
http://linked.open.../vavai/cep/soutez
| |
http://linked.open...usZobrazovaneFaze
| |
http://linked.open...ai/cep/typPojektu
| |
http://linked.open...ep/ukonceniReseni
| |
http://linked.open.../cep/vedlejsiObor
| |
http://linked.open...ep/zahajeniReseni
| |
http://linked.open...tniCyklusProjektu
| |
http://linked.open.../cep/klicoveSlovo
| - Cultural heritage
- Czech language processing
- English language processing
- Holocaust
- World War II
- audioarchive
- history
- machine translation
- oral history
- speech recognition
- speech retrieval
- videoarchive
|
is http://linked.open...vavai/riv/projekt
of | |
is http://linked.open...vavai/cep/projekt
of | |