https://www.davidsilver.uk/teaching/
Teaching - David Silver
www.davidsilver.uk
https://www.youtube.com/playlist?list=PLpRS2w0xWHTcTZyyX8LMmtbcMXpd3s4TU
강화학습의 기초 이론
www.youtube.com
David Silver 강의와 팡요랩 강의를 보고 작성하였습니다.
MDP (Markov Decision Process)
MDP는 강화학습 하면 떼어놓을 수 없는 이론이다.
'RL > 이론' 카테고리의 다른 글
강화학습 6강 Value Function Approximation (0) | 2023.01.01 |
---|---|
강화학습 5강 Model Free Control (0) | 2023.01.01 |
강화학습 4강 Model Free Prediction (1) | 2023.01.01 |
강화학습 3강 Planning by Dynamic Programming (0) | 2023.01.01 |
강화학습 1강 Introduction (0) | 2023.01.01 |