Ústav pro jazyk český AV ČR disponuje archivem TV diskusních pořadů, nahrávaných soustavně během roku 1997. Texty zachycují veřejnou mluvenou řeč, pohybující se mezi spisovností a nespisovností a je možné tyto nahrávky považovat za reprezentativní ukázku toho, jak jsme dnes schopni kultivovaně mluvit. Cílem projektu je anotovat (označkovat) korpus těchto pořadů a provést lingvistické analýzy mluvené češtiny ve všech jazykových rovinách. Vznikne tak typově speciální lingvisticky předzpracovaný korpus mluvené řeči. Ten umožní kvalifikovaně zodpovědět otázky strukturní i otázky vývoje mluveného jazyka ve všech jazykových rovinách. (cs)
The institute of Czech Language AV CR has been putting together an archive of TV discussion programs, recorded systematically since 1997. These texts document public spoken language, they reflect moves between standard and sub-stamdard way of expression, differences in spontaneous and prepared speeches. Thus, it is possible to consider these recordings for a representative sample of how correctly we are able to speak today. A pro-prepared corpus of spoken language, special in its type wil thus come into being. It will eventually answer questions about the structure and development of spoken language since all conclusions will be proved statisticall. (en)
linguistics; Czech; spoken language; corpus linguistics; dialogue analysis; discourse analysis; media discourse; grammar of spoken language; computer corporus of spoken language; tagging of spoken corpus (en)