About: Symbolická regrese pro posilované učení ve spojitých prostorech     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Projekt, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
rdfs:seeAlso
Description
  • Reinforcement Learning (RL) algorithms can optimally solve dynamic decision and control problems in engineering, economics, medicine, artificial intelligence and other disciplines. However, state-of-the-art RL methods still have not solved the transition from a small set of discrete states to large or continuous state spaces. They have to rely on function approximators, such as radial basis functions, to represent the value function and policy mappings. The choice of a suitable approximator, in terms of its structure is a difficult step which always requires significant trial-and-error tuning. The goal of the project is to automate the search process for the value function and policy approximator, so that it becomes an integral part of the learning procedure. We will further develop symbolic regression, a technique based on genetic programming, so that it can automatically find analytic functions representing the policy and value function mappings with the RL framework. The result will be a new class of RL methods suitable for continuous, high-dimensional state and action spaces. (en)
  • Algoritmy posilovaného učení (RL) umí optimálně řešit problémy dynamického rozhodování a řízení např. v technických disciplínách, ekonomice, medicíně a umělé inteligenci. Ani nejnovější metody RL ale dosud nepřekročily hranici mezi malými prostory diskrétních stavů a velkými prostory, či dokonce spojitými stavovými prostory. K reprezentaci užitkové funkce a řídicí strategie využívají tyto algoritmy funkční aproximátory, např. ve formě RBF funkcí. Výběr vhodného aproximátoru z hlediska jeho struktury je velmi obtížným krokem, který prakticky vždy vyžaduje ladění metodou pokus-omyl. Cílem tohoto projektu je zautomatizovat proces hledání vhodných aproximátorů užitkové funkce a řídicí strategie, tak aby se z něj stala nedílná součást procesu učení. K tomu chceme přizpůsobit symbolickou regresi, techniku založenou na genetickém programování, aby byla schopna automaticky hledat analytické funkce reprezentující řídicí strategii a užitkovou funkci v RL. Výsledkem bude nová třída metod RL vhodná pro spojité mnoharozměrné prostory stavů a akcí.
Title
  • Symbolická regrese pro posilované učení ve spojitých prostorech
  • Symbolic Regression for Reinforcement Learning in Continuous Spaces (en)
skos:notation
  • GA15-22731S
http://linked.open...avai/cep/aktivita
http://linked.open...kovaStatniPodpora
http://linked.open...ep/celkoveNaklady
http://linked.open...datumDodatniDoRIV
http://linked.open...i/cep/druhSouteze
http://linked.open...ep/duvernostUdaju
http://linked.open.../cep/fazeProjektu
http://linked.open...ai/cep/hlavniObor
http://linked.open...vai/cep/kategorie
http://linked.open.../cep/klicovaSlova
  • reinforcement learning; optimal control; function approximation; evolutionary optimization; symbolic regression; robotics; autonomous systems (en)
http://linked.open...ep/partnetrHlavni
http://linked.open...inujicichPrijemcu
http://linked.open...cep/pocetPrijemcu
http://linked.open...ocetSpoluPrijemcu
http://linked.open.../pocetVysledkuRIV
http://linked.open...enychVysledkuVRIV
http://linked.open.../prideleniPodpory
http://linked.open...iciPoslednihoRoku
http://linked.open...atUdajeProjZameru
http://linked.open.../vavai/cep/soutez
http://linked.open...usZobrazovaneFaze
http://linked.open...ai/cep/typPojektu
http://linked.open...ep/ukonceniReseni
http://linked.open...ep/zahajeniReseni
http://linked.open...tniCyklusProjektu
http://linked.open.../cep/klicoveSlovo
  • reinforcement learning
  • optimal control
  • robotics
  • evolutionary optimization
  • function approximation
  • symbolic regression
is http://linked.open...vavai/cep/projekt of
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 77 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software