Return1 [강화학습] Lecture 2. Markov Decision Processes I 2021-1학기 서강대 김홍석 교수님 강의 내용을 바탕으로 본 글을 작성하였습니다. Overview Markov Processes Markov Reward Processes Markov Decision Processes Entensions to MDPs ch2는 model based 기반 MRP, MDP에 대한 정의 및 예제를 다루고자 한다. 이후 ch3에서 MDP를 푸는 방법을 다룰 것이다. 1. Markov Processes ▶ Introduction to MDPs MDPs (Markov decision processes) formally describe an environment for reinforcement learning Where the environment is fully observabl.. 2021. 3. 30. 이전 1 다음