トップレベルの強さに到達した『逆転オセロニア』対戦 AI が開発できました!この発表ではプロフェッショナルがこの AI と戦ってみた感想や、この AI 技術の解説、応用先・展望について話していきます。
従来より自分たちは手軽な対戦ゲームである『逆転オセロニア』を例に様々な AI 研究を重ねてきました。例えば大量のプレイヤーログを使用した教師あり学習による対戦 AI や、デッキの自動編成 AI などは実際にゲーム内に導入し、ご利用いただいております。しかし様々なゲーム環境をより良くしていくためには、新たにリリースするキャラクターのポテンシャル推計のため、その適切な使い方も自律的に学ぶことができる最強 AI が必要になります。その一環として自分たちは逆転オセロニアにおいて自律的に試行錯誤から学ぶ強化学習で強さを極める AI 技術を開発してきました。そしてゲーム AI 作成のトッププロと共に開発を進めることで、人間の対戦データから作った教師あり学習 AI に勝る強さに到達しました。 発表では開発の鍵となった自社開発の分散強化学習フレームワーク HandyRL の紹介も行います。
トップレベルの強さに到達した『逆転オセロニア』対戦 AI が開発できました!この発表ではプロフェッショナルがこの AI と戦ってみた感想や、この AI 技術の解説、応用先・展望について話していきます。
従来より自分たちは手軽な対戦ゲームである『逆転オセロニア』を例に様々な AI 研究を重ねてきました。例えば大量のプレイヤーログを使用した教師あり学習による対戦 AI や、デッキの自動編成 AI などは実際にゲーム内に導入し、ご利用いただいております。しかし様々なゲーム環境をより良くしていくためには、新たにリリースするキャラクターのポテンシャル推計のため、その適切な使い方も自律的に学ぶことができる最強 AI が必要になります。その一環として自分たちは逆転オセロニアにおいて自律的に試行錯誤から学ぶ強化学習で強さを極める AI 技術を開発してきました。そしてゲーム AI 作成のトッププロと共に開発を進めることで、人間の対戦データから作った教師あり学習 AI に勝る強さに到達しました。 発表では開発の鍵となった自社開発の分散強化学習フレームワーク HandyRL の紹介も行います。
資料内容関連リンク集:
HandyRLで切り開く並列強化学習, https://engineering.dena.com/blog/2021/12/distributed-reinforcement-learning-with-handyrl/
GitHub - DeNA/HandyRL, https://github.com/DeNA/HandyRL
◆ You Tube
https://youtu.be/Lvn5Rzcj6ws
◆ You Tube チャンネル登録はこちら↓
https://youtube.com/c/denatech?sub_confirmation=1
◆ Twitter
https://twitter.com/DeNAxTech
◆ DeNA Engineering
https://engineering.dena.com/
◆ DeNA Engineer Blog
https://engineering.dena.com/blog/
◆ DeNA TechCon 2022 公式サイト
https://techcon2022.dena.dev/spring/