About: Using Modified Q-learning With LWR for Inverted Pendulum Control     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : http://linked.opendata.cz/ontology/domain/vavai/Vysledek, within Data Space : linked.opendata.cz associated with source document(s)

AttributesValues
rdf:type
Description
  • Lokálně vážená regrese (Locally Weighted Learning - LWR) patří mezi algoritmy aproximací, založených na lokálním modelu. Tento článek demonstruje použití LWR ve spojitosti s Q-učením. Q-učení je v současné době jeden z nejpopulárnějších a nejefektivnějších učících se algoritmů, patřících do skupiny označované jako Opakovaně posilované učení, založené na principu odměny a trestu. Nejběžnější reprezentace Q-funkce je tabulka diskrétních stavů. Pro použití spojitých stavů je nutno tuto tabulku aproximovat nějakým vhodným aproximátorem. Jako vhodný aproximátor bylo zvoleno LWR. Pro počateční pokusy aplikace LWR ve spojitosti s Q-učením byl vytvořen nenáročný model inverzního kyvadla.
  • Locally Weighted Learning (LWR) is a class of approximations, based on a local model. In this paper we demonstrate using LWR together with Q-learning for control tasks. Q-learning is the most effective and popular algorithm which belongs to the Reinforcement Learning algorithms group. This algorithm works with rewards and penalties. The most common representation of Q-function is the table. The table must be replaced by suitable approximator if use of continuous states is required. LWR is one of possiblle approximators. To get the first impression on application of LWR together with modified Q-learning for the control task a simple model of inverted pendulum was created and proposed method was applied on this model. (en)
Title
  • Using Modified Q-learning With LWR for Inverted Pendulum Control (en)
  • Použití modifikovaného Q-učení pro řízení inverzního kyvadla
  • Použití modifikovaného Q-učení pro řízení inverzního kyvadla (cs)
skos:prefLabel
  • Using Modified Q-learning With LWR for Inverted Pendulum Control (en)
  • Použití modifikovaného Q-učení pro řízení inverzního kyvadla
  • Použití modifikovaného Q-učení pro řízení inverzního kyvadla (cs)
skos:notation
  • RIV/00216305:26210/03:PU38801!RIV/2004/MSM/262104/N
http://linked.open.../vavai/riv/strany
  • 368-369
http://linked.open...avai/riv/aktivita
http://linked.open...avai/riv/aktivity
  • Z(MSM 262100024)
http://linked.open...vai/riv/dodaniDat
http://linked.open...aciTvurceVysledku
http://linked.open.../riv/druhVysledku
http://linked.open...iv/duvernostUdaju
http://linked.open...titaPredkladatele
http://linked.open...dnocenehoVysledku
  • 622109
http://linked.open...ai/riv/idVysledku
  • RIV/00216305:26210/03:PU38801
http://linked.open...riv/jazykVysledku
http://linked.open.../riv/klicovaSlova
  • Q-Learning, LWR, Continuous Space (en)
http://linked.open.../riv/klicoveSlovo
http://linked.open...ontrolniKodProRIV
  • [773A2C1B32A6]
http://linked.open...v/mistoKonaniAkce
  • Svratka
http://linked.open...i/riv/mistoVydani
  • Prague
http://linked.open...i/riv/nazevZdroje
  • ENGINEERING MECHANICS 2003
http://linked.open...in/vavai/riv/obor
http://linked.open...ichTvurcuVysledku
http://linked.open...cetTvurcuVysledku
http://linked.open...ocetUcastnikuAkce
http://linked.open...nichUcastnikuAkce
http://linked.open...UplatneniVysledku
http://linked.open...iv/tvurceVysledku
  • Březina, Tomáš
  • Věchet, Stanislav
  • Miček, Pavel
http://linked.open...vavai/riv/typAkce
http://linked.open.../riv/zahajeniAkce
http://linked.open...n/vavai/riv/zamer
number of pages
http://purl.org/ne...btex#hasPublisher
  • Institute of Theoretical and applied Mechanics Academy of sciences of the Czech Republic
https://schema.org/isbn
  • 80-86246-18-3
http://localhost/t...ganizacniJednotka
  • 26210
Faceted Search & Find service v1.16.118 as of Jun 21 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 07.20.3240 as of Jun 21 2024, on Linux (x86_64-pc-linux-gnu), Single-Server Edition (126 GB total memory, 58 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software