Description
| - The aim of the Centre is research of written and spoken Czech on a quite new level, made possible by the Czech Dependency Bank, in which the Language Data Laboratory at MFF UK has prepared a manysided semi-automatic analysis of tens of thousands sentences form texts of different kinds. This research, aiming at theoretical and applicational aspects of Computational Linguistics, based on extraordinary large data set, aims at a detailed grammatical, semantic and lexical analysis and description of Czech, using structural and statistical procedures (mathematical and computational foundations, methods and algorithms, machine learning on stochastic and other principles). The results are aplicable in human-computer communication, data mining in multilanguage texts, machine translation, etc. Longterm international cooperation concerns John Hopkins University (Baltimore), University of Pennsylvania (Philadelfia), universities in Hamburg, Saarbrücken, Pisa, Edinburgh, and INALCO (Paris). (en)
- Centrum se bude věnovat výzkumu češtiny na docela nové úrovni, tj. na základě Českého závislostního korpusu, ve kterém už je k dispozici poloautomatická analýza desítek tisíc vět z textů různého druhu (vypracovaná v Laboratoři pro zprac. jazykových datpři ÚFAL MFF UK), na několika úrovních mluvnické stavby. Jde o výzkum teoretických i aplikačních aspektů komputační lingvistiky se zaměřením na češtinu v podobě psané i mluvené s využitím mimořádně rozsáhlých dat pro podrobný gramatický, sémantický alexikální rozbor a popis češtiny na základě strukturních a statistických postupů (matematické a výpočetní základy, metody a algoritmy komputační lingvistiky, metody učení z dat, stochastické i založené na pravidlech). Pozornost bude věnována i zpracovánívíce jazyků pro vyhled. informací ve vícejaz. textech a strojový překlad. Mezinárodní dlouhodobá spolupráce: John Hopkins Univ., Baltimore, Univ. of Pennsylvania, Phil., USA, univerzity v Hamburku, v Saarbrückenu, v Pise, v Edinburghu a INALCO v Paříži. (cs)
|