Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BPStudy#138_Shogi_document
Search
Gokosho
February 27, 2019
0
7.7k
BPStudy#138_Shogi_document
Gokosho
February 27, 2019
Tweet
Share
Featured
See All Featured
Bash Introduction
62gerente
604
210k
Testing 201, or: Great Expectations
jmmastey
27
6.3k
The Cult of Friendly URLs
andyhume
74
5.7k
YesSQL, Process and Tooling at Scale
rocio
163
13k
Automating Front-end Workflow
addyosmani
1355
200k
Web development in the modern age
philhawksworth
202
10k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
29
6k
Become a Pro
speakerdeck
PRO
10
4.5k
The Language of Interfaces
destraynor
151
23k
For a Future-Friendly Web
brad_frost
171
8.9k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
1
1.3k
Side Projects
sachag
451
41k
Transcript
お品書き • 将棋AI進歩の歴史 • 将棋AIによるプロ棋界の流行の変化 • 棋力向上のためのソフト活用術
自己紹介 名前:杵渕 哲彦 – 大学院で将棋を題材にした研究 – 縁あって現職HEROZに – 現在はゲームAI系の業務に従事
将棋との付き合い • 小学校低学年でルールを覚える • 高校で将棋部に入り、将棋沼に落ちる • 将棋で研究したいがために東京に • 有段者いっぱいな会社に入る
将棋AI進歩の歴史 ~「ルール通りに指す」から「名人に勝つ」まで ~
アプローチの変遷 • 1975年~2000年代前半 – 人から知識を教えられる • 2000年代中盤~2010年代前半 – 人の真似をする •
2010年代中盤~ – 自ら学ぶ
人から知識を教えられる時代 • 代表的な出来事 – 初の対局プログラム(1975年) – コンピュータ将棋選手権の開催(1990年) – 最長手数1525手詰めの詰将棋「ミクロコスモ ス」がプログラムによって解かれる(1997年)
– コンピュータとの公開対局禁止令(2005年)
ミクロコスモス http://www005.upp.so-net.ne.jp/tsumepara/contents/4appre/mc/microc.htm
人から知識を教えられる時代 • 棋力:アマ五~六段 • 技術面 – 局面の表し方と評価方法は人間が決定 (ex. 金が7八にいる場合は100点) –
ヒューリスティックによる読みの効率化 (ex. 良さそうな手は深く、悪そうな手は浅く)
人の真似をする時代 • 代表的な出来事 – Bonanzaの登場(2005年) – 渡辺竜王Bonanza戦(2007年) – Bonanzaのソースコードが公開(2009年) –
あから2010が清水女流王位に勝利(2011年) – 電王戦開催(2012年) – ponanzaが現役プロ棋士に初めて勝利(2013年)
人の真似をする時代 • 棋力:トッププロを上回る程度 • 技術面 – 局面の表し方が3駒関係 – 局面の評価方法は人間の棋譜から学習 –
複数マシンの活用(クラスタと合議制)
稲庭将棋
自ら学ぶ時代 • 代表的な出来事 – NDFによる強化学習の成功(2013年) – Ponanzaが現役の名人に初めて勝利(2017年) – AlphaZeroの登場(2017年)
自ら学ぶ時代 • 棋力:トッププロをはるかに超える • 技術面 – 局面の評価方法は自身が読んだ結果から学習 – NNによる非線形な評価関数
これから • 自ら学ぶ時代は続く – 特にNNの評価関数はまだ発展途上 • 個人的には… そろそろ振り飛車の良さを理解して欲しい
将棋AIによる プロ棋界の流行の変化
最近の将棋の 何でもあり感は異常
その影に将棋AIあり 西尾六段が挙げる将棋AIから学ぶ理由 1. 実力の高さ – 自分達より強いという保証された実力 2. 幅広い指し手 – 強化学習による常識にとらわれない指し手
3. 豊富な情報量 – 評価値や読み筋が記載された大量の棋譜
矢倉で見る流行の変化 • 矢倉 – 相居飛車の一大ジャンル – お互い堅く囲って先手が攻め後手が受けるの が基本的な展開 – 2010年頃は4六銀3七桂型が主流で先手勝率
が高い (2011,12の名人戦13局中6局登場 先手の5勝)
矢倉で見る流行の変化 • 矢倉
矢倉にまつわる新手新構想 • GPS新手 – 初めてA級棋士に勝った際の新手 • Ponanza新手 – 名人戦で登場 4六銀3七桂型下火の始まり
• 左美濃急戦 – 後手から動ける有力な急戦 減少傾向加速 • 雁木戦法 – 矢倉は終わりました
GPS新手 ・代表局 第2回電王戦第5局 三浦GPS戦
GPS新手の影響 • A級順位戦(-戦)でも指されるなど、 将棋AIの手をトップ棋士が使う流れに • これまでの常識ではありえなかった、 △7五歩▲同歩△8四銀という筋が 認められる
ponanza新手 ・代表局 第71期名人戦第5局 羽生森内戦
ponanza新手の影響 • 矢倉の主流だった4六銀3七桂戦法の形 勢判断に大きな影響 • 4六銀3七桂戦法そのものを再検証する 動きが生まれ、さらに追い打ちをかける 塚田流の誕生へ
左美濃急戦 ・代表局 第1期叡王戦 森内阿部光戦
左美濃急戦の影響 • 左美濃 + 6三銀7三桂型で△6五歩の仕掛 けの優秀性が認められる • 左美濃急戦対策に対して旧来の急戦が見 直される •
がっぷり四つの相矢倉がほぼ姿を消す
雁木戦法 ・代表局 第48期新人王戦 増田近藤誠戦
雁木戦法の影響 • ツノ銀、腰掛け銀、早繰り銀、右玉など 様々な組み合わせが試されている • 様々な戦型で雁木囲いの構えが選択肢の 一つとして用いられる
一昔前の角換わり ・先手の攻めを 後手が受ける ・繰り広げられる パス合戦
最近の角換わり ・4八金2九飛型 ・必ずしも玉が 入城しない ・桂馬をすぐ跳ねる
最新の角換わり ・代表局 第48期新人王戦 増田近藤誠戦 ・最新の形に、パス が有効であるとい う概念が融合
まとめ プロの将棋AIによる影響の受け止め方は 1. まず真似る 2. 手筋や考え方のレベルに抽象化する 3. 既存の概念と組み合わせる 自由で多様な将棋が生まれる
棋力向上のためのソフト活用術
強く…なりたい
ソフトを使うとしたら • 対局相手 利点:いつでも気楽に対局できる 欠点:対人戦の代わりには必ずしもならない • 検討相手 利点:自分より強い人?の意見が聞ける 欠点:人間的な価値観で表現してくれない 今日はこっちの話
プロ棋士の場合 千田翔太六段 – コンピュータ将棋活用のパイオニア – 順位戦B2 竜王戦4組 タイトル挑戦1回 – ソフトから学ぶ方法を文章に
してくれている
千田翔太六段の方法 1. 棋譜解析で評価値の推移を確認 2. 評価値の下がった箇所をミスと判断 3. 評価値と読みを手掛かりに、コンピュー タに近づける形で感覚を修正
評価値の推移 将棋ウォーズの 棋神解析 ShogiGUIの 評価値グラフ
感覚の修正方法 最善手と自分の手を比較して… • 理由が推測できる場合 – 判断項目の価値を調整 – 新たな判断項目の追加 • 理由がすぐには推測できない場合
– その局面から何局も指す – 分岐する局面の評価値を見て傾向を掴む
この局面でどう感覚修正したか
今回の修正項目 • 判断項目の価値の調整 – 後手を引いて相手の馬の働きが良くなる展開 の価値を下げる – 持ち駒の金を受けに使う展開の価値を上げる – 攻め駒が不足していない局面での金の持ち駒
の価値を下げる
• 参考文献 – 西尾 明:コンピュータは将棋をどう変えたか? マイナビ出版(2018) – 瀧澤武信:コンピュータ将棋の最近の動向 情報処理,Vol.51,No.8,pp.991-1000 (2010)
– 千田翔太:プロ棋士から見たコンピュータ将棋の活用 情報処理,Vol.59,No.2,pp.157-160 (2018)