본문 바로가기

RL/이론

강화학습 2강 MDP

https://www.davidsilver.uk/teaching/

 

Teaching - David Silver

 

www.davidsilver.uk

https://www.youtube.com/playlist?list=PLpRS2w0xWHTcTZyyX8LMmtbcMXpd3s4TU 

 

강화학습의 기초 이론

 

www.youtube.com

David Silver 강의와 팡요랩 강의를 보고 작성하였습니다.


MDP (Markov Decision Process)

MDP는 강화학습 하면 떼어놓을 수 없는 이론이다.