Q-learning is the most popular and effective version of reinforcement Learning algorithms. In this paper we discuss the possibility of control of a nonstationary system by Q-learning. the non-stationary system is represented by simple inverted pendulum simulation model with variable pendulum length. (en)
Metoda Q-učení patří mezi velice populární učicí se algoritmy. V tomto článku je ukázáno jak je možné použít tuto metodu pro řízení nestacionární soustavy. Jako modelová soustava slouží velice jednoduchý model inversního kyvadla s proměnnou délkou kyvadla.
Metoda Q-učení patří mezi velice populární učicí se algoritmy. V tomto článku je ukázáno jak je možné použít tuto metodu pro řízení nestacionární soustavy. Jako modelová soustava slouží velice jednoduchý model inversního kyvadla s proměnnou délkou kyvadla. (cs)