Attributes | Values |
---|
rdf:type
| |
rdfs:seeAlso
| |
Description
| - Reinforcement Learning (RL) algorithms can optimally solve dynamic decision and control problems in engineering, economics, medicine, artificial intelligence and other disciplines. However, state-of-the-art RL methods still have not solved the transition from a small set of discrete states to large or continuous state spaces. They have to rely on function approximators, such as radial basis functions, to represent the value function and policy mappings. The choice of a suitable approximator, in terms of its structure is a difficult step which always requires significant trial-and-error tuning. The goal of the project is to automate the search process for the value function and policy approximator, so that it becomes an integral part of the learning procedure. We will further develop symbolic regression, a technique based on genetic programming, so that it can automatically find analytic functions representing the policy and value function mappings with the RL framework. The result will be a new class of RL methods suitable for continuous, high-dimensional state and action spaces. (en)
- Algoritmy posilovaného učení (RL) umí optimálně řešit problémy dynamického rozhodování a řízení např. v technických disciplínách, ekonomice, medicíně a umělé inteligenci. Ani nejnovější metody RL ale dosud nepřekročily hranici mezi malými prostory diskrétních stavů a velkými prostory, či dokonce spojitými stavovými prostory. K reprezentaci užitkové funkce a řídicí strategie využívají tyto algoritmy funkční aproximátory, např. ve formě RBF funkcí. Výběr vhodného aproximátoru z hlediska jeho struktury je velmi obtížným krokem, který prakticky vždy vyžaduje ladění metodou pokus-omyl. Cílem tohoto projektu je zautomatizovat proces hledání vhodných aproximátorů užitkové funkce a řídicí strategie, tak aby se z něj stala nedílná součást procesu učení. K tomu chceme přizpůsobit symbolickou regresi, techniku založenou na genetickém programování, aby byla schopna automaticky hledat analytické funkce reprezentující řídicí strategii a užitkovou funkci v RL. Výsledkem bude nová třída metod RL vhodná pro spojité mnoharozměrné prostory stavů a akcí.
|
Title
| - Symbolická regrese pro posilované učení ve spojitých prostorech
- Symbolic Regression for Reinforcement Learning in Continuous Spaces (en)
|
skos:notation
| |
http://linked.open...avai/cep/aktivita
| |
http://linked.open...kovaStatniPodpora
| |
http://linked.open...ep/celkoveNaklady
| |
http://linked.open...datumDodatniDoRIV
| |
http://linked.open...i/cep/druhSouteze
| |
http://linked.open...ep/duvernostUdaju
| |
http://linked.open.../cep/fazeProjektu
| |
http://linked.open...ai/cep/hlavniObor
| |
http://linked.open...vai/cep/kategorie
| |
http://linked.open.../cep/klicovaSlova
| - reinforcement learning; optimal control; function approximation; evolutionary optimization; symbolic regression; robotics; autonomous systems (en)
|
http://linked.open...ep/partnetrHlavni
| |
http://linked.open...inujicichPrijemcu
| |
http://linked.open...cep/pocetPrijemcu
| |
http://linked.open...ocetSpoluPrijemcu
| |
http://linked.open.../pocetVysledkuRIV
| |
http://linked.open...enychVysledkuVRIV
| |
http://linked.open.../prideleniPodpory
| |
http://linked.open...iciPoslednihoRoku
| |
http://linked.open...atUdajeProjZameru
| |
http://linked.open.../vavai/cep/soutez
| |
http://linked.open...usZobrazovaneFaze
| |
http://linked.open...ai/cep/typPojektu
| |
http://linked.open...ep/ukonceniReseni
| |
http://linked.open...ep/zahajeniReseni
| |
http://linked.open...tniCyklusProjektu
| |
http://linked.open.../cep/klicoveSlovo
| - reinforcement learning
- optimal control
- robotics
- evolutionary optimization
- function approximation
- symbolic regression
|
is http://linked.open...vavai/cep/projekt
of | |