Atari2600 をプレイ
・Rainbow [黒366]
・Agent57 (DQNベース)[黒393]
Dota2 をプレイ
・OpenAI Five (マルチエージェント強化学習。学習アルゴリズムはPPO, Proximal Policy Optimization)[黒393]
参考文献: ***は、ページ番号。
[黒***] 『徹底攻略ディープラーニングG検定ジェネラリスト問題集』第3版
Atari2600 をプレイ
・Rainbow [黒366]
・Agent57 (DQNベース)[黒393]
Dota2 をプレイ
・OpenAI Five (マルチエージェント強化学習。学習アルゴリズムはPPO, Proximal Policy Optimization)[黒393]
参考文献: ***は、ページ番号。
[黒***] 『徹底攻略ディープラーニングG検定ジェネラリスト問題集』第3版