"The project ""From a Natural Language to Knowledge and the Semantic Web"" focuses on the interlinking linguistic and content analysis (and synthesis). It is based on deep syntax analysis as captured in the Prague Dependency Treebank. The project objective is to design and implement such representation of knowledge contained in common text that can formally and logically capture the content of a message in natural language. Natural demand for this knowledge representation is language independence. Unavoidable language-dependent phenomena will be exactly determined, language relations defined, and conversions between representations of the same knowledge in different languages will be implemented. The Project will be focused at least on two languages (Czech and English). A sufficient amount of linguistically annotated data necessary for machine learning methods will be also prepared. Project results will be utilizable for information extraction as well as for automatic machine translation." (en)
"Projekt ""Od jazyka ke znalostem a sématickému webu"" řeší propojení jazykové a obsahové analýzy (popř. syntézy) textu. Navazuje na hloubkovou jazykovou analýzu, popsanou a datově zachycenou v tzv. Pražském závislostním korpusu. Cílem projektu je navrhnout a implementovat takovou reprezentaci znalostí obsažených v běžném textu, která dokáže formálně-logickým způsobem zachytit obsah sdělení, a to v celé šíři přirozeného jazyka. Přirozeným požadavkem na takovou reprezentaci je to, aby byla jako systém jazykově nezávislá. Jazykově závislé části budou přesně vymezeny a budou definovány vztahy a implementovány ""konverze"" mezi reprezentacemi téhož obsahu mezi různými přirozenými jazyky. Projekt bude proto zaměřen nejméně na dva jazyky (češtinu a angličtinu). Metody analýzy a syntézy potřebují dostatečné množství anotovaných dat pro strojové učení, která budou rovněž připravena. Výsledky budou využitelné jak pro extrakci informací a znalostí, tak i pro automatický překlad mezi jazyky." (cs)
natural language processing; knowledge representation; formal and lexical semantics; information extraction; computational linguistics; language corpora (en)