Reinforcement Learning (d.silver)

2.3 The 10-armed Testbed

by Keep It Simple, Stupid! 2020. 7. 24.

2.2에서 다룬 내용 기준으로 test 한 결과를 설명한다.

The 10-armed Testbed

위에서 분포가 어떻게 그려지는지 생각해보자...

[강화학습] Lecture 2. Markov Decision Processes I (0)	2021.03.30
2.2 Action-value Methods (0)	2020.07.24

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

DeepHaejoong