ゲームAI

ゲームAIAtari2600 をプレイ
・Rainbow [黒366]
・Agent57 (DQNベース)[黒393]

Dota2 をプレイ
・OpenAI Five (マルチエージェント強化学習。学習アルゴリズムはPPO, Proximal Policy Optimization)[黒393]