About: Symbolická regrese pro posilované učení ve spojitých prostorech

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Symbolická regrese pro posilované učení ve spojitých prostorech Goto Sponge NotDistinct Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

Attributes	Values
rdf:type	http://linked.opendata.cz/ontology/domain/vavai/Projekt
rdfs:seeAlso	http://www.isvav.cz/projectDetail.do?rowId=GA15-22731S
Description	Reinforcement Learning (RL) algorithms can optimally solve dynamic decision and control problems in engineering, economics, medicine, artificial intelligence and other disciplines. However, state-of-the-art RL methods still have not solved the transition from a small set of discrete states to large or continuous state spaces. They have to rely on function approximators, such as radial basis functions, to represent the value function and policy mappings. The choice of a suitable approximator, in terms of its structure is a difficult step which always requires significant trial-and-error tuning. The goal of the project is to automate the search process for the value function and policy approximator, so that it becomes an integral part of the learning procedure. We will further develop symbolic regression, a technique based on genetic programming, so that it can automatically find analytic functions representing the policy and value function mappings with the RL framework. The result will be a new class of RL methods suitable for continuous, high-dimensional state and action spaces. (en) Algoritmy posilovaného učení (RL) umí optimálně řešit problémy dynamického rozhodování a řízení např. v technických disciplínách, ekonomice, medicíně a umělé inteligenci. Ani nejnovější metody RL ale dosud nepřekročily hranici mezi malými prostory diskrétních stavů a velkými prostory, či dokonce spojitými stavovými prostory. K reprezentaci užitkové funkce a řídicí strategie využívají tyto algoritmy funkční aproximátory, např. ve formě RBF funkcí. Výběr vhodného aproximátoru z hlediska jeho struktury je velmi obtížným krokem, který prakticky vždy vyžaduje ladění metodou pokus-omyl. Cílem tohoto projektu je zautomatizovat proces hledání vhodných aproximátorů užitkové funkce a řídicí strategie, tak aby se z něj stala nedílná součást procesu učení. K tomu chceme přizpůsobit symbolickou regresi, techniku založenou na genetickém programování, aby byla schopna automaticky hledat analytické funkce reprezentující řídicí strategii a užitkovou funkci v RL. Výsledkem bude nová třída metod RL vhodná pro spojité mnoharozměrné prostory stavů a akcí.
Title	Symbolická regrese pro posilované učení ve spojitých prostorech Symbolic Regression for Reinforcement Learning in Continuous Spaces (en)
skos:notation	GA15-22731S
http://linked.open...avai/cep/aktivita	Standard projects
http://linked.open...kovaStatniPodpora	http://linked.opendata.cz/resource/domain/vavai/projekt/GA15-22731S/celkovaStatniPodpora
http://linked.open...ep/celkoveNaklady	http://linked.opendata.cz/resource/domain/vavai/projekt/GA15-22731S/celkoveNaklady
http://linked.open...datumDodatniDoRIV	2015-04-23 (xsd:date)
http://linked.open...i/cep/druhSouteze	VS - Veřejná soutěž ve výzkumu a vývoji
http://linked.open...ep/duvernostUdaju	S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
http://linked.open.../cep/fazeProjektu	100816099
http://linked.open...ai/cep/hlavniObor	JD - Využití počítačů, robotika a její aplikace
http://linked.open...vai/cep/kategorie	ZV - Základní výzkum
http://linked.open.../cep/klicovaSlova	reinforcement learning; optimal control; function approximation; evolutionary optimization; symbolic regression; robotics; autonomous systems (en)
http://linked.open...ep/partnetrHlavni	Český institut informatiky, robotiky a kybernetiky
http://linked.open...inujicichPrijemcu	0 (xsd:int)
http://linked.open...cep/pocetPrijemcu	1 (xsd:int)
http://linked.open...ocetSpoluPrijemcu	0 (xsd:int)
http://linked.open.../pocetVysledkuRIV	0 (xsd:int)
http://linked.open...enychVysledkuVRIV	0 (xsd:int)
http://linked.open.../prideleniPodpory	http://linked.opendata.cz/resource/domain/vavai/cep/prideleniPodpory/15-22731S
http://linked.open...iciPoslednihoRoku	2015
http://linked.open...atUdajeProjZameru	2015
http://linked.open.../vavai/cep/soutez	SGA0201500001
http://linked.open...usZobrazovaneFaze	DRRVZ
http://linked.open...ai/cep/typPojektu	P - Projekt výzkumu a vývoje financovaný ze státního rozpočtu
http://linked.open...ep/ukonceniReseni	2017-12-31 (xsd:date)
http://linked.open...ep/zahajeniReseni	2015-01-01 (xsd:date)
http://linked.open...tniCyklusProjektu	Z
http://linked.open.../cep/klicoveSlovo	reinforcement learning optimal control robotics evolutionary optimization function approximation symbolic regression
is http://linked.open...vavai/cep/projekt of	http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA15-22731S/2015/orjk%3A21730 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA15-22731S/2016/orjk%3A21730 http://linked.opendata.cz/resource/domain/vavai/cep/ucast/GA15-22731S/2017/orjk%3A21730

Faceted Search & Find service v1.16.118 as of Jun 21 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 77 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software