Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

Improving Prediction Performance and Model Inte...

Improving Prediction Performance and Model Interpretability through Attention Mechanisms from Basic and Applied Research Perspectives (Presentation for Doctoral Dissertation)

Slides for the presentation of my doctoral dissertation (in Japanese).
The contents of the presentation are already published as the following papers:
- Section 2: Kitada and Iyatomi IEEE Access'21. https://arxiv.org/abs/2009.12064
- Section 3: Kitada and Iyatomi. Appl. Intell.'22. https://arxiv.org/abs/2104.08763
- Section 4: Kitada et al. KDD'19. https://arxiv.org/abs/1905.07289
- Section 5: Kitada et al. Appl. Sci.'22. https://arxiv.org/abs/2204.11588

Avatar for Shunsuke KITADA

Shunsuke KITADA

March 24, 2023
Tweet

More Decks by Shunsuke KITADA

Other Decks in Science

Transcript

  1. Improving Prediction Performance and Model Interpretability through Attention Mechanisms from

    Basic and Applied Research Perspectives Ph.D. candidate: Shunsuke Kitada Supervisor: Prof. Hitoshi Iyatomi Graduate School of Science and Engineering, Hosei University Doctoral Dissertation Defence, Jan. 27th, 2023.
  2. # 本発衚の抂芁 - 基瀎・応甚 研究の芳点からの泚意機構による 予枬性胜・モデルの解釈可胜性の向䞊 第1ç« : 導入 Introduction 第2ç« :

    泚意機構に察する敵察的孊習 [Kitada+ IEEE Access’21] Adversarial Training for Attention Mechanisms 第3ç« : 泚意機構に察する仮想敵察的孊習 [Kitada+ Appl. Intell.’22] Virtual Adversarial Training for Attention Mechanisms 第4ç« : 泚意機構を元にした枠組みによる 広告クリ゚むティブの効果予枬 [Kitada+ KDD’19] Ad Creative Conversion Prediction with Attention Mechanisms 第5ç« : 泚意機構を元にした枠組みによる 広告クリ゚むティブの停止予枬 [Kitada+ Appl. Sci.’22] Ad Creative Discontinuation Prediction with Attention Mechanisms 第6ç« : 第7ç« : 議論 ず 結論 Discussion and Conclusion
  3. 3 発衚の流れ 第2ç«  [Kitada+ IEEE Access’21] 泚意機構に察する敵察的孊習 教垫あり孊習 第3ç«  [Kitada+

    Appl. Intell.’22] 泚意機構に察する仮想敵察的孊習 半教垫あり孊習 第4ç«  [Kitada+ KDD’19] 泚意機構を元にした枠組みによる 広告クリ゚むティブの効果予枬 第5ç«  [Kitada+ Appl. Sci.’22] 泚意機構を元にした枠組みによる 広告クリ゚むティブの停止予枬 第1ç«  導入 基瀎・応甚 研究の芳点からの泚意機構による予枬性胜・モデルの解釈可胜性の向䞊 第6・7ç«  議論ず結論 本研究の適甚範囲・解釈性・埌続研究に䞎えた圱響 および 結論 半教垫あり孊習 ぞ拡匵 広告入皿前ず埌 各運甚を支揎 効果の高い広告の 運甚支揎 倧量に埗られる ラベルなしデヌタ の有効掻甚 効果の䜎い広告の 運甚支揎
  4. 人工知胜の発展に倧きく貢献しおいる DL [LeCun+’15] • 埓来の ML モデルず比范しお DL モデルは予枬性胜が飛躍的に向䞊 ◩

    コンピュヌタビゞョン (computer vision; CV) や 自然蚀語凊理 (natural language processing; NLP) では人間を超える性胜を達成 [CV; Russakovsky+ IJCV’15, NLP; Devlin+ NAACL’19, etc.] DLモデルのブラックボックス性 • DL モデルは構造が非垞に耇雑 (倚数の非線圢倉換) であるため その予枬の解釈や説明が困難 [Castelvecchi+ Nature’16] 💡 今埌 ML/DL モデルの䜿甚頻床が高くなるこずが予想される ➜ 予枬結果の劥圓性やその根拠を解釈できるようにするこずが 利甚者 にずっおモデルの 信頌性 や 実甚性 の芳点から重芁 第1ç« : 導入 - 人工知胜 (artifitial intelligence; AI) 分野における 機械孊習 (machine learning; ML) ず深局孊習 (deep learning; DL) の発展 5 第1ç« : 導入 入力: 画像, 蚀語, 音声, etc. 出力: 分類, 回垰, 生成, etc. DL モデル (䞍透明; not transparent)
  5. Black-box な ML/DL モデルの予枬結果の解釈を目指す分野 • ルヌルベヌスの説明を䞭心に叀くから研究 [Swartout+’85, Scott+ CL’97] •

    2017 幎の DARPA プログラムで再泚目 [DARPA’17, Gunning+ AI Magazine’19] 説明可胜 AI における “解釈性” や “説明性” • これらに察しお目的や芁件を明確化する動き [Arrieta+ Inf. Fusion’20, Adadi+ IEEE Access’18, Guidotti+ CSUR’18] Arrieta+ [Inf. Fusion’20] (匕甚数3400+) における説明可胜 AI の定矩 “Given an audience, an explainable Artificial Intelligence is one that produces details or reasons to make its functioning clear or easy to understand.” [Arrieta+ Inf. Fusion’20] “説明可胜 AIずは、聞き手がいる堎合にその予枬を明確に、 あるいは容易に理解できるような詳现や理由を䜜り出す AIのこず” • 説明可胜 AI は特に解釈を必芁ずする “聞き手” の存圚を重芖 ◩ 提瀺すべき詳现や理由は聞き手に䟝存するず䞻匵 説明可胜 AI (explainable AI) の発展ずその定矩 6 第1ç« : 導入
  6. Arrieta+ [Inf. Fusion’20] の定矩に同意 • 聞き手 (研究者・開発者・サヌビス運甚者 etc.) を察象に䞋蚘の達成を目指す 本論文の解釈性:

    • 基瀎研究の偎面: DL モデルを扱うナヌザを察象 ◩ 耇数の予枬に察する解釈手法が瀺す根拠が同䞀ずなるような解釈を䞎えるこず • 応甚研究の偎面: オンラむンサヌビスの運甚者を察象 ◩ 運甚者の意思決定をサポヌトするような解釈を䞎えるこず 本論文の察象: 自然蚀語凊理を行う深局孊習モデル • NLP タスク を解く際の 入力文字列の各単語に察する予枬の解釈 ◩ 入力に察しおモデルが予枬に寄䞎する箇所を “聞き手” に 解釈可胜ずするこずで䞊蚘を達成可胜であるずする ◩ DL モデルによる入力の寄䞎床を確認可胜ずするこずで、実䞖界で モデルを運甚する際の゚ラヌ分析や意思決定に関しお圹に立぀ 本研究における倧目暙 - “理解を優しくする理由や詳现を提瀺するAI” 7 第1ç« : 導入
  7. DLモデルの予枬の解釈に向けた研究の流れ 2. モデルの予枬に察する post-hoc な説明 10 第1ç« : 導入 • 予枬に圱響を䞎える芁因の可芖化

    [Simonyan+ ICLR’14, Selvaraju+ ICCV’17, Abnar+ ACL’20] • 予枬に察しお具䜓䟋をあげた説明 [Zhang+ INR’20] [Selvaraju+ ICCV’17] GradCAM For CNN [Abnar+ ACL’20] Rollout For Transformer Vanilla Grad Figure from [Smilkov CoRR’17] 可芖化結果は 非垞にノむゞヌ
  8. DLモデルの予枬の解釈に向けた研究の流れ 2. モデルの予枬に察する post-hoc な説明 11 第1ç« : 導入 • 予枬に圱響を䞎える芁因の可芖化

    [Simonyan+ ICLR’14, Selvaraju+ ICCV’17, Abnar+ ACL’20] • 予枬に察しお具䜓䟋をあげた説明 [Zhang+ INR’20] 🀖この商品は XX を元に掚薊 されおいたす
  9. DLモデルの予枬の解釈に向けた研究の流れ 2. モデルの予枬に察する post-hoc な説明 12 第1ç« : 導入 • 予枬に圱響を䞎える芁因の可芖化

    [Simonyan+ ICLR’14, Selvaraju+ ICCV’17, Abnar+ ACL’20] • 予枬に察しお具䜓䟋をあげた説明 [Zhang+ INR’20] 🀖この商品は XX を元に掚薊 されおいたす 👍 䞀般的なDLモデルに適甚可胜であり、透明なモデルを 蚭蚈・孊習するよりも簡単で幅広く利甚されおいる
  10. 1. 予枬結果に察する募配に基づく重芁床による説明 • 掚論結果から入力空間に募配を写像backward方向 ◩ 出力 y に関する入力 x の偏埮分を蚈算

    ◩ gc は特定の出力クラス c に察する 各入力 (語) の重芁床を捉える 👎 入力に敏感で床々芖芚的にノむゞヌな堎合が倚い 2. 泚意機構の重みによる説明 • 入力に察しお特定の箇所に焊点が圓たるよう孊習 (forward 方向) ◩ キヌ K ず ク゚リ Q に察しお 泚意スコア関数 S から泚意を蚈算 ◩ 察象のタスクを予枬する際に寄䞎する郚分の重みが倧きくなる DLの予枬の解釈に頻繁に甚いられる post-hoc 説明 13 第1ç« : 導入 入力: movie was pretty good 出力: positive movie was pretty good movie was pretty good forward backward
  11. DLモデルの解釈に甚いられる予枬結果の募配ず 泚意の重みによる post-hoc 説明の匱点 Jain & Wallace [NAACL’19] では 次のような珟象が報告されおいる:

    • 募配によっお重芁ず掚定される箇所 ず泚意の重みによっお埗られる箇所 ずの間には必ずしも匷い盞関が無い • 泚意機構ぞの小さな摂動は意図 しない予枬倉化をもたらす ◩ 泚意機構を欺くような敵察的 摂動は曎に倧きな予枬誀差になる 泚意機構に倧きく䟝存する近幎の DL モデルにおいお䞊蚘の匱点は深刻 • 募配や泚意によるDLモデルの予枬解釈手法は発展しおいるが 頑健で信頌性の高い解釈を埗るかは重芁は 基瀎研究 の方向性 14 第1ç« : 導入 損倱募配による予枬の解釈 泚意の重みによる予枬の解釈
  12. 実䞖界で運甚される DL モデルにおける解釈の提䟛 実応甚を芋据えた実䞖界デヌタによる DL モデルの研究は少ない • これたでの泚意機構を有する DL モデルは公開ベンチマヌクが

    豊富にあるドメむンで開発が進行 ◩ 機械翻蚳 [Vaswani+ NeurIPS’17]、機械読解 [Devlin+ NAACL’19]、 画像認識 [Dosovitskiy+ ICLR’20] 等 ➜ これらの開発や評䟡は、敎備されお公開されたデヌタを 元にしたいわゆる 実隓宀環境 に限定されおいる • 公開デヌタが䞍足 (i.e., 耇雑な暩利関係等の圱響) 実応甚を芋据えた DL モデルの解釈性評䟡は曎に少ない • 運甚䞊の意思決定を支揎するような詳现を提䟛するこずが重芁 ◩ 初歩的な説明機構 (e.g., シンプルな泚意機構) でも十分 • 倧芏暡な実デヌタに察しお解釈可胜なモデルを実甚化するための 研究は珟状で限られおいるため、重芁な 応甚研究 の方向性 15 第1ç« : 導入
  13. 本発衚の貢献: 泚意機構による予枬性胜・モデルの解釈性の向䞊 基瀎研究 の偎面 • 予枬性胜の向䞊 ◩ 昚今の DL モデルに広く利甚されおいる

    泚意機構の問題克服 ▪ 泚意機構におけるノむズ・摂動に察する脆匱性の解消 • 解釈性の向䞊 ◩ 耇数の根拠提瀺手法が同䞀の根拠を瀺すこずによる 信頌性向䞊 ◩ 明確な泚意を孊習・提瀺するこずによるで 容易な解釈を提瀺 応甚研究 の偎面 • 予枬性胜の向䞊 ◩ 蚈算機広告分野の運甚䞊の 実問題を取り䞊げお定匏化 ▪ 泚意機構を取り入れ実䞖界の課題を高い粟床で予枬可胜に • 解釈性の向䞊 ◩ ビゞネス䞊重芁ずなる効果の高い広告の特城や、 効果の䜎い広告を停止する際に 運甚者に予枬根拠 を提瀺 16 第1ç« : 導入
  14. 第2ç«  基瀎研究 泚意機構に察する敵察的孊習 抂芁 予枬性胜の向䞊 • Adversarial training (AT) [Goodfellow+

    ICLR’14] を甚いお泚意機構 を隙すような摂動を入力し摂動に察する泚意の脆匱性を克服 ◩ AT for attention mechanism (Attention AT) ▪ 泚意機構に察しお敵察的摂動に頑健になるように孊習 ◩ Interpretable AT for attention mechanism (Attention iAT) ▪ 摂動ありの入力文に察しお泚意の差がより倧きくなるように孊習 解釈性の向䞊 • 泚意ず募配の関係が盞関するように ◩ 説明可胜 AI の定矩の芳点から耇数の解釈提瀺手法 (e.g., 泚意, 募配) が同様の解釈を瀺すように • 明確な泚意を孊習可胜に ◩ 予枬を解釈する “聞き手” に察しおより分かりやすい解釈結果を提瀺 # 第2ç« : 泚意機構のための敵察的孊習 (背景)
  15. 埓来の NLP における敵察的孊習 AT for word embedding [Miyato + ICLR'17]

    • NLP では入力が離散単語か぀ 疎 で あるため有効な敵察的摂動の蚈算が困難 • 連続である単語埋め蟌み空間ぞの AT の 適甚により data augmentation 効果・ 汎化性胜の向䞊 [Miyato + ICLR'17] Interpretable AT for word embedding [Sato+ ICJAI'18] • 単語埋め蟌み空間においお、 摂動の方向を既存の単語方向に限定する こずで擬䌌的な単語の眮き換えを実珟 䞊蚘は摂動の解釈性向䞊に焊点を圓おおおり モデルの予枬の解釈性向䞊ずは無関係 19 第2ç« : 泚意機構のための敵察的孊習 (背景) 単語埋め蟌みをPCA等 で2次元にした堎合の空間 A man is walking ➜ A woman is walking 解釈可胜な摂動を導入した堎合
  16. 泚意機構のための敵察孊習 | ベヌスモデル 提案手法を適甚するベヌスモデル Jain & Wallace [NAACL’19] に埓い、加法泚意 [Bahdanau+

    ICLR’15] を 有する双方向 LSTM をベヌスモデルずしお䜿甚 • 入力局 ◩ 単語埋め蟌み • äž­é–“å±€ ◩ 加法泚意 [Bahdanau+ ICLR’15] ➜ 提案法はこの郚分に適甚される • 出力局 ◩ 察象のタスクを予枬するよう孊習 20 第2ç« : 泚意機構のための敵察的孊習 (手法)
  17. 泚意機構のための敵察孊習 | ベヌスモデル 提案手法を適甚するベヌスモデル Jain & Wallace [NAACL’19] に埓い、加法泚意 [Bahdanau+

    ICLR’15] を 有する双方向 LSTM をベヌスモデルずしお䜿甚 • 入力局 ◩ 単語埋め蟌み • äž­é–“å±€ ◩ 加法泚意 [Bahdanau+ ICLR’15] ➜ 提案法はこの郚分に適甚される • 出力局 ◩ 察象のタスクを予枬するよう孊習 21 第2ç« : 泚意機構のための敵察的孊習 (手法)
  18. Attention AT のアむディア: 泚意機構 ã に AT を適甚 • 泚意に察する敵察的摂動は、珟圚のモデル

    の損倱を最倧化する 方向の摂動 (倧きさ: ε) ずしお定矩 • 泚意の重みに敵察的摂動を 加えた ã adv を新たな泚意の 重みずしお孊習に䜿甚 • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための敵察孊習 Attention AT (adversarial training for attention) 22 第2ç« : 泚意機構のための敵察的孊習 (手法)
  19. Attention AT のアむディア: 泚意機構 ã に AT を適甚 • 泚意に察する敵察的摂動は、珟圚のモデル

    の損倱を最倧化する 方向の摂動 (倧きさ: ε) ずしお定矩 • 泚意の重みに敵察的摂動を 加えた ã adv を新たな泚意の 重みずしお孊習に䜿甚 • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための敵察孊習 Attention AT (adversarial training for attention) 23 第2ç« : 泚意機構のための敵察的孊習 (手法) 泚意の重みに摂動が 加えられた時の入力単語列
  20. Attention AT のアむディア: 泚意機構 ã に AT を適甚 • 泚意に察する敵察的摂動は、珟圚のモデル

    の損倱を最倧化する 方向の摂動 (倧きさ: ε) ずしお定矩 • 泚意の重みに敵察的摂動を 加えた ã adv を新たな泚意の 重みずしお孊習に䜿甚 • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための敵察孊習 Attention AT (adversarial training for attention) 24 第2ç« : 泚意機構のための敵察的孊習 (手法) 泚意の重みに摂動が 加えられた時の入力単語列 泚意の重み
  21. Attention AT のアむディア: 泚意機構 ã に AT を適甚 • 泚意に察する敵察的摂動は、珟圚のモデル

    の損倱を最倧化する 方向の摂動 (倧きさ: ε) ずしお定矩 • 泚意の重みに敵察的摂動を 加えた ã adv を新たな泚意の 重みずしお孊習に䜿甚 • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための敵察孊習 Attention AT (adversarial training for attention) 25 第2ç« : 泚意機構のための敵察的孊習 (手法) 泚意の重みに摂動が 加えられた時の入力単語列 摂動 泚意の重み
  22. 泚意機構のための敵察孊習 Attention AT (adversarial training for attention) 26 第2ç« : 泚意機構のための敵察的孊習

    (手法) Attention AT のアむディア: 泚意機構 ã に AT を適甚 • 泚意に察する敵察的摂動は、珟圚のモデル の損倱を最倧化する 方向の摂動 (倧きさ: ε) ずしお定矩 • 泚意の重みに敵察的摂動を 加えた ã adv を新たな泚意の 重みずしお孊習に䜿甚 • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意の重みに摂動が 加えられた時の入力単語列 摂動 正解ラベル 泚意の重み
  23. Interpretable AT for word [Sato+ IJCAI’18] ず数匏䞊は同じ Attention iAT は摂動に頑健ずなるよう泚意の差を

    匷調するように孊習 ➜明確で解釈可胜な泚意に぀ながる • 文䞭における各単語に察する泚意床の差分 を蚈算 • 孊習可胜なパラメヌタを持぀ 泚意の摂動 を定矩 • 損倱を最倧化するような パラメヌタずなるよう 泚意床の差分を蚈算 泚意機構のための解釈可胜敵察孊習 Attention iAT (Interpretable adversarial training for attention) 27 第2ç« : 泚意機構のための敵察的孊習 (手法) where, where, 摂動 正解ラベル 泚意の重みに摂動が 加えられた時の入力単語列
  24. 実隓蚭定 | 比范手法 Vanilla • 加法泚意あり 1 å±€ 双方向 LSTM

    Word AT (AT for word embeddings) • 単語埋め蟌みに AT による摂動を付䞎 Word iAT (interpretable AT for word embeddings) • 単語埋め蟌みに iAT による摂動を付䞎 Attention RP (random perturbation for attention) • 泚意機構にランダムノむズによる摂動を付䞎 Attention AT (AT for attention) • 泚意機構に AT による摂動を付䞎 Attention iAT (interpretable AT for attention) • 泚意機構に iAT による摂動を付䞎 28 第2ç« : 泚意機構のための敵察的孊習 (実隓)
  25. 実隓蚭定 | 比范手法 Vanilla • 加法泚意あり 1 å±€ 双方向 LSTM

    Word AT (AT for word embeddings) • 単語埋め蟌みに AT による摂動を付䞎 Word iAT (interpretable AT for word embeddings) • 単語埋め蟌みに iAT による摂動を付䞎 Attention RP (random perturbation for attention) • 泚意機構にランダムノむズによる摂動を付䞎 Attention AT (AT for attention) • 泚意機構に AT による摂動を付䞎 Attention iAT (interpretable AT for attention) • 泚意機構に iAT による摂動を付䞎 29 第2ç« : 泚意機構のための敵察的孊習 (実隓)
  26. 実隓蚭定 | 比范手法 Vanilla • 加法泚意あり 1 å±€ 双方向 LSTM

    Word AT (AT for word embeddings) • 単語埋め蟌みに AT による摂動を付䞎 Word iAT (interpretable AT for word embeddings) • 単語埋め蟌みに iAT による摂動を付䞎 Attention RP (random perturbation for attention) • 泚意機構にランダムノむズによる摂動を付䞎 Attention AT (AT for attention) • 泚意機構に AT による摂動を付䞎 Attention iAT (interpretable AT for attention) • 泚意機構に iAT による摂動を付䞎 30 第2ç« : 泚意機構のための敵察的孊習 (実隓)
  27. 実隓蚭定 | 評䟡甚デヌタセットず指暙 予枬性胜の評䟡 (2倀分類; F1 score) • Stanford Sentiment

    Treebank (SST) [Socher+ EMNLP’13] • IMDB Movie Review Corpus [Maas+ ACL’11] • 20Newsgroups Corpus [Lang+ ICML’95] • AgNews Corpus [Zhang+ NeurIPS’15] 解釈性の評䟡 • 泚意の重みず掚論結果の募配の ピア゜ン盞関を蚈算 • Jain & Wallace [NAACL’19] では ケンドヌルの順䜍盞関を利甚 ◩ 順䜍が䜎いがノむゞヌになりやすく党䜓の評䟡がそれらに 圱響を受けおしたうため、2぀の関係を適切に評䟡するのは 難しくなるずの指摘 [Mohankumar+ ACL’20] を考慮 31 第2ç« : 泚意機構のための敵察的孊習 (実隓) movie was pretty good movie was pretty good 掚論結果の募配による 単語の重芁床 孊習枈み泚意の重み ピア゜ン盞関による 2手法の傟向調査 The The
  28. 結果 | 2倀分類 予枬性胜 • 提案法はベヌスラむンを始め埓来の単語に察する AT を超える性胜 • 泚意にランダムな摂動を加えるより敵察的摂動を加えたほうが良い

    • 特に提案する Attention iAT は 20News ず MultiNLI 以倖で最良 解釈性 • 提案法における泚意の重みず掚論結果の募配は匷く盞関 • 特に Attention iAT は匷い盞関 (= より解釈しやすい説明) を瀺すように 32 第2ç« : 泚意機構のための敵察的孊習 (結果) [Miyato+ ICLR’17] [Sato+ IJCAI’18]
  29. 結果 | 2倀分類 予枬性胜 • 提案法はベヌスラむンを始め埓来の単語に察する AT を超える性胜 • 泚意にランダムな摂動を加えるより敵察的摂動を加えたほうが良い

    • 特に提案する Attention iAT は 20News ず MultiNLI 以倖で最良 解釈性 • 提案法における泚意の重みず掚論結果の募配は匷く盞関 • 特に Attention iAT は匷い盞関 (= より解釈しやすい説明) を瀺すように 33 第2ç« : 泚意機構のための敵察的孊習 (結果) [Miyato+ ICLR’17] [Sato+ IJCAI’18]
  30. 結果 | 2倀分類 予枬性胜 • 提案法はベヌスラむンを始め埓来の単語に察する AT を超える性胜 • 泚意にランダムな摂動を加えるより敵察的摂動を加えたほうが良い

    • 特に提案する Attention iAT は 20News ず MultiNLI 以倖で最良 解釈性 • 提案法における泚意の重みず掚論結果の募配は匷く盞関 • 特に Attention iAT は匷い盞関 (= より解釈しやすい説明) を瀺すように 34 第2ç« : 泚意機構のための敵察的孊習 (結果) [Miyato+ ICLR’17] [Sato+ IJCAI’18]
  31. 35 第2ç« : 泚意機構のための敵察的孊習 (結果) Vanilla Attention AT Attention iAT 結果

    | 泚意の重みず募配による単語の重芁床の可芖化
  32. 39 第2ç« : 泚意機構のための敵察的孊習 (結果) Vanilla Attention AT Attention iAT Attention

    AT は Vanilla モデルや Attention iAT に比べおより明確な 泚意を孊習から獲埗 ➜ Attention AT は少数の単語に 匷く泚意を集䞭させる傟向あり
  33. 43 第2ç« : 泚意機構のための敵察的孊習 (結果) Vanilla Attention AT Attention iAT Attention

    iAT は泚意の重みず 募配による単語の重芁床の盞関が 䞀番高かった 泚意の差を元にした摂動の決定ず その孊習が、より効果的に入力文の 重芁箇所を特定可胜に
  34. 結論 | 泚意機構のための敵察的孊習 本研究では泚意機構のための敵察的孊習手法を提案 • 先行研究で指摘されおいた泚意機構に関する脆匱性に泚目 ◩ 泚意機構をより頑健で解釈可胜にする新たな技術 ◩ 埓来の単語埋め蟌みに察する敵察的孊習よりも良い性胜

    提案法は高い予枬性胜ず明確な泚意を孊習可胜で 孊習枈みの泚意は単語の重芁床ず匷い盞関 • 異なる根拠提瀺手法が同様の根拠を瀺すこずで信頌性向䞊を期埅 本研究の远加の議論 • 第 3 章にお本研究の半教垫あり孊習ぞの拡匵に぀いお議論 • 第 6 章にお本研究における適甚範囲ず解釈性に぀いお議論 44 第2ç« : 泚意機構のための敵察的孊習 (結論)
  35. 第3ç«  基瀎研究 泚意機構に察する仮想敵察的孊習 抂芁 予枬性胜の向䞊 • 教垫ラベル情報が必芁な第 2 章の AT

    ベヌスの手法に察しお、 Virtual AT を甚いお半教垫あり孊習ぞ拡匵 [Miyato+ TPAMI’18] ◩ Virtual AT for attention (Attention VAT) ▪ ラベルなしデヌタによる敵察的摂動を甚いお頑健ずなるよう孊習 ◩ Interpretable AT for attention (Attention iVAT) ▪ 有効だった Attention iAT をラベルなしデヌタの䜿甚で曎に向䞊 解釈性の向䞊 • 泚意ず募配の関係が曎に盞関するように ◩ 倧芏暡なデヌタを孊習可胜ずなり提案する解釈もより頑健に • 人手によっおアノテヌションされた根拠箇所ず 提案法が瀺す根拠箇所の䞀臎床が向䞊 ◩ より人間が考える根拠ず同様の解釈を提瀺可胜に # 第3ç« : 泚意機構のための仮想敵察的孊習 (背景)
  36. 泚意機構のための仮想敵察的孊習 | 抂芁 50 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) ラベルあり 正䟋デヌタ点 ラベルあり

    負䟋デヌタ点 入力デヌタ (ラベルなし) および その泚意の重みず察応するデヌタ点 (黄䞞)
  37. 泚意機構のための仮想敵察的孊習 | 抂芁 51 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) ラベルあり 正䟋デヌタ点 ラベルあり

    負䟋デヌタ点 ラベルなしだが 負䟋デヌタに近いデヌタ点 ラベルなしだが 正䟋デヌタに近いデヌタ点 入力デヌタ (ラベルなし) および その泚意の重みず察応するデヌタ点 (黄䞞)
  38. 泚意機構のための仮想敵察的孊習 | 抂芁 52 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) ラベルあり 正䟋デヌタ点 ラベルあり

    負䟋デヌタ点 ラベルなしだが 負䟋デヌタに近いデヌタ点 ラベルなしだが 正䟋デヌタに近いデヌタ点 デヌタ点が限られるために過孊習を 匕き起こしおいる分類境界 入力デヌタ (ラベルなし) および その泚意の重みず察応するデヌタ点 (黄䞞)
  39. 泚意機構のための仮想敵察的孊習 | 抂芁 53 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 入力デヌタ (ラベルなし) および

    その泚意の重みず察応するデヌタ点 (黄䞞) デヌタ点が限られるために過孊習を 匕き起こしおいる分類境界 黄䞞デヌタ点においお仮想敵察的 摂動の方向 rVAT を蚈算
  40. 泚意機構のための仮想敵察的孊習 | 抂芁 54 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 入力デヌタ (ラベルなし) および

    その泚意の重みず察応するデヌタ点 (黄䞞) デヌタ点が限られるために過孊習を 匕き起こしおいる分類境界 黄䞞デヌタ点においお仮想敵察的 摂動の方向 rVAT を蚈算 泚意の重みは正䟋のように芋えるが 過孊習した分類境界も盞たっお 敵察的摂動によっお負䟋ずしお 分類されおしたう玫䞞デヌタ点を生成
  41. 泚意機構のための仮想敵察的孊習 | 抂芁 55 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 入力デヌタ (ラベルなし) および

    その泚意の重みず察応するデヌタ点 (黄䞞) デヌタ点が限られるために過孊習を 匕き起こしおいる分類境界 提案手法によっおモデルを蚓緎するず 
  42. 泚意機構のための仮想敵察的孊習 | 抂芁 56 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 入力デヌタ (ラベルなし) および

    その泚意の重みず察応するデヌタ点 (黄䞞) デヌタ点が限られるために過孊習を 匕き起こしおいる分類境界 提案手法によっおモデルを蚓緎するず  分類境界は滑らかに より頑健な分類境界を孊習
  43. Attention VAT のアむディア: 泚意機構 ã に VAT を適甚 • ラベルあり

    & ラベルなしデヌタを含むデヌタセット を元に 珟圚のモデル の損倱を最倧化する方向の仮想敵察的摂動を蚈算 • 敵察的摂動 は Miyato+ [TPAMI’18] を参考に以䞋の匏で蚈算: • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための仮想敵察孊習 Attention VAT (virtual adversarial training for attention) 57 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 通垞入力ずランダム摂動 r を泚意に加えた入力 の KL 距離が最倧化するような摂動を蚈算 泚意の重みに敵察的摂動を加えた ã vadv を 新たな泚意の重みずしお孊習に䜿甚
  44. Attention VAT のアむディア: 泚意機構 ã に VAT を適甚 • ラベルあり

    & ラベルなしデヌタを含むデヌタセット を元に 珟圚のモデル の損倱を最倧化する方向の仮想敵察的摂動を蚈算 • 敵察的摂動 は Miyato+ [TPAMI’18] を参考に以䞋の匏で蚈算: • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための仮想敵察孊習 Attention VAT (virtual adversarial training for attention) 58 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 入力単語列ず その時の泚意 通垞入力ずランダム摂動 r を泚意に加えた入力 の KL 距離が最倧化するような摂動を蚈算 泚意の重みに敵察的摂動を加えた ã vadv を 新たな泚意の重みずしお孊習に䜿甚 泚意の重み
  45. Attention VAT のアむディア: 泚意機構 ã に VAT を適甚 • ラベルあり

    & ラベルなしデヌタを含むデヌタセット を元に 珟圚のモデル の損倱を最倧化する方向の仮想敵察的摂動を蚈算 • 敵察的摂動 は Miyato+ [TPAMI’18] を参考に以䞋の匏で蚈算: • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための仮想敵察孊習 Attention VAT (virtual adversarial training for attention) 59 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 泚意の重みに摂動が 加えられた時の入力単語列 入力単語列ず その時の泚意 通垞入力ずランダム摂動 r を泚意に加えた入力 の KL 距離が最倧化するような摂動を蚈算 泚意の重みに敵察的摂動を加えた ã vadv を 新たな泚意の重みずしお孊習に䜿甚 泚意の重み
  46. Attention VAT のアむディア: 泚意機構 ã に VAT を適甚 • ラベルあり

    & ラベルなしデヌタを含むデヌタセット を元に 珟圚のモデル の損倱を最倧化する方向の仮想敵察的摂動を蚈算 • 敵察的摂動 は Miyato+ [TPAMI’18] を参考に以䞋の匏で蚈算: • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための仮想敵察孊習 Attention VAT (virtual adversarial training for attention) 60 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 泚意の重みに摂動が 加えられた時の入力単語列 摂動 入力単語列ず その時の泚意 泚意の重み 通垞入力ずランダム摂動 r を泚意に加えた入力 の KL 距離が最倧化するような摂動を蚈算 泚意の重みに敵察的摂動を加えた ã vadv を 新たな泚意の重みずしお孊習に䜿甚
  47. Attention VAT のアむディア: 泚意機構 ã に VAT を適甚 • ラベルあり

    & ラベルなしデヌタを含むデヌタセット を元に 珟圚のモデル の損倱を最倧化する方向の仮想敵察的摂動を蚈算 • 敵察的摂動 は Miyato+ [TPAMI’18] を参考に以䞋の匏で蚈算: • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための仮想敵察孊習 Attention VAT (virtual adversarial training for attention) 61 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 泚意の重みに摂動が 加えられた時の入力単語列 摂動 入力単語列ず その時の泚意 通垞の入力衚珟に近くなるよう、 摂動が加えられた入力衚珟を孊習 ラベルあり & なしデヌタ 通垞入力ずランダム摂動 r を泚意に加えた入力 の KL 距離が最倧化するような摂動を蚈算 泚意の重みに敵察的摂動を加えた ã vadv を 新たな泚意の重みずしお孊習に䜿甚 泚意の重み
  48. Attention VAT のアむディア: 泚意機構 ã に VAT を適甚 • ラベルあり

    & ラベルなしデヌタを含むデヌタセット を元に 珟圚のモデル の損倱を最倧化する方向の仮想敵察的摂動を蚈算 • 敵察的摂動 は Miyato+ [TPAMI’18] を参考に以䞋の匏で蚈算: • 摂動がない状態ずある状態 それぞれを考慮しお孊習 泚意機構のための仮想敵察孊習 Attention VAT (virtual adversarial training for attention) 62 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) 泚意の重みに摂動が 加えられた時の入力単語列 摂動 入力単語列ず その時の泚意 通垞の入力衚珟に近くなるよう、 摂動が加えられた入力衚珟を孊習 ラベルあり & なしデヌタ 通垞入力ずランダム摂動 r を泚意に加えた入力 の KL 距離が最倧化するような摂動を蚈算 泚意の重みに敵察的摂動を加えた ã vadv を 新たな泚意の重みずしお孊習に䜿甚 ラベル情報が必芁ない 泚意の重み
  49. Attention iVAT はラベルなしデヌタも有効掻甚し、 摂動に頑健ずなるように泚意の差を匷調するよう孊習 • 文䞭における各単語に察する泚意床の差分 を蚈算 • 孊習可胜なパラメヌタを持぀ 泚意の摂動

    を定矩 • 損倱を最倧化するパラメヌタずなるような 泚意床の差分を蚈算 泚意機構のための解釈可胜仮想敵察孊習 Attention iVAT (interpretable virtual adversarial training for attention) 63 第3ç« : 泚意機構のための仮想敵察的孊習 (手法) where, where, 摂動 入力単語列ずその泚意 泚意の重みに摂動が 加えられた時の入力単語列 ラベル情報が必芁ない
  50. 実隓蚭定 | 評䟡指暙 Jain & Wallace [NAACL’19] ず第2章に合わせお以䞋を䜿甚 予枬性胜の評䟡 •

    単䞀文入力タスク: F1 score • ペア文入力タスク: acc., micro-F1 解釈性の評䟡 • 泚意の重みず掚論結果の募配に よる重芁床間のピア゜ン盞関 • 予枬根拠提瀺の再珟性 ◩ 人手で予枬根拠箇所にラベルが付䞎された ERASER [DeYoung+ ACL’20] デヌタセットを䜿甚 ▪ 根拠箇所の確率倀による soft な予枬の評䟡 • Area under the precision-recall curve (AUPRC) • average precision (AP) 64 第3ç« : 泚意機構のための仮想敵察的孊習 (実隓) Movie Reviews: In this movie, 
 Plots to take over the world. The acting is great! The soundtrack is run-of-the-mill, but the action more than makes up for it (a) Positive (b) Negative ERASER デヌタセットに含たれる 映画レビュヌに関するデヌタの䟋 [DeYoung+ ACL’20]
  51. 結果 | 予枬性胜 66 第3ç« : 泚意機構のための仮想敵察的孊習 (結果) • 半教垫あり孊習ぞ拡匵した Attention

    VAT が最良の結果に ◩ 同じく半教垫あり孊習の Word VAT よりも良い ◩ 効果的であった Attention AT よりも曎に良い • 倧芏暡か぀倚様なラベルなしデヌタにより分類境界を より滑らかずなるこずで過孊習を倧幅に抑制できた可胜性 ◩ 限られたラベルありデヌタに加えおラベルなしデヌタを䜿甚 するこずで有効な孊習を実珟
  52. 結果 | 予枬性胜 69 第3ç« : 泚意機構のための仮想敵察的孊習 (結果) • Attention iVAT

    は Attention VAT よりも良い結果に ◩ 文䞭の泚意差に着目した敵察的摂動の蚈算ず、远加したラベルなし デヌタの効果によっお、より効果的にタスクを予枬する分類境界 を孊習可胜に
  53. 結果 | 予枬性胜 70 第3ç« : 泚意機構のための仮想敵察的孊習 (結果) • Attention iVAT

    は Attention VAT よりも良い結果に ◩ 文䞭の泚意差に着目した敵察的摂動の蚈算ず、远加したラベルなし デヌタの効果によっお、より効果的にタスクを予枬する分類境界 を孊習可胜に
  54. 結果 | 解釈可胜性: 泚意ず募配の盞関 72 第3ç« : 泚意機構のための仮想敵察的孊習 (結果) • 予枬性胜ず同様に提案法

    Attention VAT が最良の結果に ◩ 同じく半教垫あり孊習の Word VAT よりも良い ◩ 効果的であった Attention AT よりも曎に良い • ラベルなしデヌタの远加により、入力文に察する普遍的な 予枬根拠箇所の孊習が曎に促進 ◩ 限られたラベルありデヌタに加えおラベルなしデヌタを䜿甚 するこずで有効な孊習を実珟
  55. 結果 | 解釈可胜性: 泚意ず募配の盞関 75 第3ç« : 泚意機構のための仮想敵察的孊習 (結果) • Attention

    AT/iAT でも十分なスコアを瀺しおいたにも かかわらず、Attention VAT/iVAT では曎にスコア向䞊 ◩ ラベルなしデヌタの利甚が効果的であったこずを確認
  56. 結果 | 解釈可胜性: 人手の根拠ずの比范 76 第3ç« : 泚意機構のための仮想敵察的孊習 (結果) 泚意の重みによる予枬根拠箇所ず人手による根拠の比范 •

    ベヌスラむン (Vanilla) や単語埋め蟌みに察する VAT/iVAT 手法ず 比范しお提案法は人手根拠に近い予枬を瀺した ◩ 提案法がより人間に解釈しやすい泚意を瀺すこずが可胜 • 人手の根拠ラベルを教垫ずした根拠予枬モデル BERT-to-BERT ず は䟝然スコアの開きがある ◩ 我々の手法は人手の根拠ラベルを䜿甚しおいない
  57. 結論 | 泚意機構のための仮想敵察的孊習 • 半教垫あり孊習である 泚意機構のための 仮想敵察的孊習 (Attention VAT/iVAT) を提案

    ◩ 第 2 章で説明した効果的であった Attention AT/iAT を拡匵 • 提案法は ラベルなしデヌタを有効に掻甚 するこずで 予枬性胜ず解釈可胜性の䞡方のパフォヌマンスを向䞊 ◩ 埓来の VAT ベヌスの手法を超える性胜を実珟 • 泚意機構を有するモデルに提案手法のアむディアは 適甚可胜で汎甚性が非垞に高い手法 ◩ 本研究では泚意機構の脆匱性が報告されおいた RNN ベヌスのシンプルな手法で実隓を実斜した ▪ Transformer や BERT ベヌスの手法ぞの拡匵怜蚎 に぀いおは第6章にお議論する 77 第3ç« : 泚意機構のための仮想敵察的孊習 (結論)
  58. 78 発衚の流れ 第2ç«  [Kitada+ IEEE Access’21] 泚意機構に察する敵察的孊習 教垫あり孊習 第3ç«  [Kitada+

    Appl. Intell.’22] 泚意機構に察する仮想敵察的孊習 半教垫あり孊習 第4ç«  [Kitada+ KDD’19] 泚意機構を元にした枠組みによる 広告クリ゚むティブの効果予枬 第5ç«  [Kitada+ Appl. Sci.’22] 泚意機構を元にした枠組みによる 広告クリ゚むティブの停止予枬 第1ç«  導入 基瀎・応甚 研究の芳点からの泚意機構による予枬性胜・モデルの解釈可胜性の向䞊 第6ç«  結論 泚意機構を頑健にする手法の提案・実䞖界の倧芏暡デヌタによる有効性の実蚌 半教垫あり孊習 ぞ拡匵 広告入皿前ず埌 各運甚を支揎 効果の高い広告の 運甚支揎 倧量に埗られる ラベルなしデヌタ の有効掻甚 効果の䜎い広告の 運甚支揎
  59. 第4ç« : 泚意機構を元にした枠組みによる 広告クリ゚むティブの評䟡予枬 Shunsuke Kitada, Hitoshi Iyatomi, and Yoshifumi Seki.

    “Conversion Prediction Using Multi-task Conditional Attention Networks to Support the Creation of Effective Ad Creative,” Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. pp. 2069-2077. 2019. 79
  60. 第4ç«  応甚研究 泚意機構を元にした枠組みによる 広告クリ゚むティブの “評䟡" 予枬 予枬性胜の向䞊 • 広告を通じたナヌザの行動を “事前”

    に予枬する方法論の怜蚎 ◩ こうした行動は頻繁には発生しないため困難なタスクである ▪ 段階的に起こるナヌザヌ行動 (クリック ➜ コンバヌゞョン) を同時に予枬する マルチタスク孊習 の導入 ▪ 広告の属性倀を考慮するこずで予枬性胜の向䞊を 期埅できる conditional attention 機構の提案 解釈可胜性の向䞊 • 広告テキストに察しおナヌザが関心のあるフレヌズを捉えお 可芖化可胜な attention highlighting の提案 ◩ 広告の属性倀を考慮した conditional attention 機構により ナヌザ行動の予枬に寄䞎する単語を解釈可胜な圢で提瀺 # 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (背景)
  61. 背景 | 広告クリ゚むティブ • ディスプレむ広告における 広告クリ゚むティブ ◩ 賌買察象ずなる顧客に察しお 効果的に商品の情報を届ける ▪

    商品を説明する テキストや画像が䞭心 • クリ゚むティブの良し悪しを評䟡する指暙 ◩ ナヌザがクリックする割合 (click through rate; CTR) ◩ クリック埌に商品の賌入等の行動 (conversion; CV) が 起きる割合 (CV rate; CVR) ➜ CV が倚い広告は配信効果が高いず蚀える 広告䞻からは配信効果が高い広告クリ゚むティブを 䜜るこずが期埅されおいる 81 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (背景)
  62. 背景 | 広告クリ゚むティブの事前評䟡 本研究の目的 CV数の倚い広告クリ゚むティブの䜜成支揎 • 広告クリ゚むティブのテキストからCV数を事前に 予枬・評䟡する、運甚をサポヌトする新たな枠組みを提案 広告クリ゚むティブのテキストに泚目した評䟡 •

    広告画像の差し替えは難しいが、テキストの差し替えは 容易であるため運甚䞊でもテキストに焊点が圓おられる • 提案する枠組みは様々なテキストから探玢的に効果的な 広告クリ゚むティブを䜜成するのに圹立぀ ◩ 広告䜜成者にずっおナヌザがどのような蚎求テキストを 魅力的に感じるかを解釈可胜 82 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (背景)
  63. 実隓蚭定 | ベヌスラむン手法ずの比范 • ベヌスラむンモデルずの比范 ◩ Support vector regression (SVR)

    ◩ Multi-layer perceptron (MLP) • シングル/マルチタスク孊習の比范 ◩ Single-task model (CVのみを予枬するモデル) ◩ Multi-task model (CVずクリックを同時に予枬するモデル) • 泚意機構の比范 ◩ Vanilla (泚意機構を有さない) ◩ 埓来の self-attention [Lin+ ICLR’17] ◩ 提案する conditional attention (proposed) 91 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (実隓)
  64. 実隓蚭定 | デヌタセットず評䟡指暙に぀いお 評䟡甚実䞖界広告クリ゚むティブデヌタセット Gunosy で配信された広告クリ゚むティブ (‘17/8 ~ ‘18/8) •

    衚瀺回数が極端に少ないものは陀去 評䟡指暙 高 CV のクリ゚むティブを正確に予枬できおいるかを評䟡 • Normalized discounted cumulative gain (NDCG) [JÀrvelin+ TOIS’02] ◩ i 番目の順䜍を評䟡する指暙。倧きければ倧きいほど良い ◩ 順䜍䞊䜍CVが倚いサンプルの評䟡が圱響を䞎える 92 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (実隓) Creative #1 CV数 小 Creative #2 Creative #... Creative #N CV数 倧 予枬CV数 倧 CVが倚いクリ゚むティブを 正しく評䟡できる
  65. 実隓蚭定 | 広告クリ゚むティブデヌタセットの性質 CV 数はほずんど 0 ➜ クリック数ず比べお非垞に䞍均衡 • 盎接

    CV に結び぀く特城をDLモデルで孊習するのは困難を極める CV数ずクリック数には匷い盞関がある (r = 0.816) • 盞関する2぀の指暙を同時に予枬するこずで有益な特城孊習を期埅 93 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (実隓) クリック数ず CV 数の分垃 クリック数ずコンバヌゞョン数の関係
  66. 実隓結果 | NDCG の芳点から比范 • 提案する conditional attention を有する枠組みが最良 ◩

    クリック数ず CV 数を孊習するこずで、モデルは暗黙の うちに CV 予枬に寄䞎する特城を孊習しおいる • 利益を䞊げおいる CV 数䞊䜍 1 %に絞ったずきの性胜に着目 ◩ 提案手法においお CV 数が䞊䜍のものを適切に予枬可胜 94 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (結果) 評䟡時の察象デヌタ: All: すべおのデヌタを察象 #CV top 1%: CV数䞊䜍1%
  67. 実隓結果 | NDCG の芳点から比范 • 提案する conditional attention を有する枠組みが最良 ◩

    クリック数ず CV 数を孊習するこずで、モデルは暗黙の うちに CV 予枬に寄䞎する特城を孊習しおいる • 利益を䞊げおいる CV 数䞊䜍 1 %に絞ったずきの性胜に着目 ◩ 提案手法においお CV 数が䞊䜍のものを適切に予枬可胜 95 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (結果) 評䟡時の察象デヌタ: All: すべおのデヌタを察象 #CV > 0: CV数が0以䞊
  68. 実隓結果 | NDCG の芳点から比范 • 提案する conditional attention を有する枠組みが最良 ◩

    クリック数ず CV 数を孊習するこずで、モデルは暗黙の うちに CV 予枬に寄䞎する特城を孊習しおいる • 利益を䞊げおいる CV 数䞊䜍 1 %に絞ったずきの性胜に着目 ◩ 提案手法においお CV 数が䞊䜍のものを適切に予枬可胜 96 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (結果) 評䟡時の察象デヌタ: All: すべおのデヌタを察象 #CV > 0: CV数が0以䞊
  69. 実隓結果 | 属性情報を考慮可胜な Conditional attention における泚意の可芖化結果 • 男性察象だず「男性」郚分にモデルが泚芖しおいる • 党䜓的な傟向ずしお「◊◊監修」が泚芖されやすい

    ◩ 特城ずしお匷い有名人の人名に共起しおいる堎合が倚い 配信察象に適した広告文の性質を盎感的に捉えるこずが可胜 可芖化結果を元にした広告文の䜜成や修正の支揎を担える可胜性 97 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (結果)
  70. 結論 | 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 広告クリ゚むティブの効果を事前に予枬する枠組みの提案 および実䞖界の広告デヌタセットを䜿った実甚性を重芖した評䟡 • マルチタスク孊習 を甚いた䞍均衡デヌタに察する孊習 ◩ CVずクリックを同時に孊習させるこずで、こうした

    比范的皀な行動の予枬に察する予枬粟床が向䞊 • Conditional attention 機構 の提案 ◩ 予枬性胜の向䞊に加えお広告配信察象やクリ゚むティブの ゞャンルずいった属性倀を考慮した attention の決定 広告テキストに察しおナヌザが関心のあるフレヌズを捉えお 可芖化可胜な attention highlighting の提案 • 重芁単語の可芖化に基づく効果的な広告クリ゚むティブ䜜成 支揎の怜蚎が可胜 ➜ この解釈性に぀いおは第6章で議論 98 第4ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの評䟡予枬 (結論)
  71. 第5ç«  応甚研究 泚意機構を元にした枠組みによる 広告クリ゚むティブの “停止” 予枬 予枬性胜の向䞊 • 効果が悪くなった広告に察しお 適切なタむミングで停止の刀断を支揎する方法論の怜蚎

    ◩ 生存時間予枬の枠組みによる粒床の现かい停止確率予枬の実珟 ◩ 泚意機構によっお停止に寄䞎する広告テキストの特城を孊習 解釈性胜の向䞊 • 埓来の 分類や回垰では限られおいた现かい単䜍の予枬 の提瀺 ◩ 広告運甚者に察しおより詳现の停止予枬状況を説明可胜 • 広告運甚者に察しお 広告の停止予枬に寄䞎する単語を提瀺 可胜 ◩ ナヌザが興味を瀺さなかった・時事的に旬ではなくなった単語 等 ◩ 情報公開の制玄のため具䜓的な泚意による解釈性の定量的評䟡は できおいないが、運甚者を支揎するに足る情報を日々提䟛しおいる # 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (背景)
  72. 本研究の目的 | 広告クリ゚むティブの停止予枬 • 広告停止による運甚負担の軜枛 ◩ 倧量に入皿・運甚される広告の運甚効率化 ▪ 泚力すべきずころである「より良い広告の運甚」に 集䞭できるような支揎

    ▪ 配信実瞟のある広告が停止するず予枬されたずきに 次の斜策を準備可胜 • 将来の停止を確率的に予枬できる解釈可胜なモデルの構築 ◩ 生存時間予枬ず泚意機構の枠組みを掻甚 ▪ 未来に起こるクリ゚むティブの停止を各時間間隔ごずに 確率ずしお提瀺し、曎に予枬に圱響ある箇所を可芖化可胜 ◩ 長期的に効果が期埅できるクリ゚むティブを事前に発芋 ▪ より運甚で䌞ばす方向に時間を䜿うこずができる 101 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (背景)
  73. 提案手法 | 生存時間予枬による広告クリ゚むティブの停止予枬 芳枬デヌタからある時刻でむベント (i.e., 広告停止) が発生したかを予枬 入力: 芳枬デヌタ 出力:

    各時間間隔におけるむベント発生の確率 察数尀床 102 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (手法) 特城ベクトル 芳枬時刻 むベント: 継続 or 停止 p 次元の共倉量 区間に分割した時間間隔 時刻τで発生する事象の確率 ハザヌド関数
  74. 提案手法 | 生存時間予枬による広告クリ゚むティブの停止予枬 芳枬デヌタからある時刻でむベント (i.e., 広告停止) が発生したかを予枬 入力: 芳枬デヌタ 出力:

    各時間間隔におけるむベント発生の確率 察数尀床 察数尀床を最倧化 ➜ 負の察数尀床を最小化する 103 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (手法) 特城ベクトル 芳枬時刻 むベント: 継続 or 停止 DLモデルの出力 ハザヌド関数
  75. 提案手法 抂芁 106 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (手法) 入力: 広告クリ゚むティブを構成する特城量 • テキスト特城

    ◩ タむトル・説明文 • カテゎリカル特城 ◩ 配信察象の性別・広告ゞャンル • 画像特城 ◩ クリ゚むティブの広告画像 • 数倀特城 ◩ 日次配信実瞟impression, click, conversion, CPA ◩ 配信実瞟の時系列情報
  76. 提案手法 | “2期間掚定法” ず ”売䞊を元にした損倱項” 2期間掚定法: 広告クリ゚むティブ停止の2぀の偎面に着目 • 停止には短期の打ち切りず長期の摩耗が存圚 ◩

    短期モデル: 売り切りを予枬するための特城を孊習 ◩ 長期モデル: 摩耗を予枬するための特城を孊習 売䞊を元にした損倱項: CTR重み付け損倱 • CTR の高い (≒ 収益床合いが高い) 広告クリ゚むティブの特城を正確に捉える新たな損倱項を定矩 110 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (手法)
  77. 実隓蚭定 | 評䟡デヌタセットず指暙 実䞖界の広告クリ゚むティブデヌタセットによる評䟡 • 株匏䌚瀟 Gunosy から提䟛された 2018 幎〜2019

    幎 1,000,000 ä»¶ のデヌタセットで評䟡 ◩ キャンペヌンに基づいた局別分割を ◩ 蚓緎 600,000 件、開発 200,000 件、評䟡 200,000 ä»¶ 生存時間予枬の枠組みにおける性胜比范 • Concordance index (CI) [Harrell+ JAMA’82] ◩ 予枬したむベント発生時間ず実際のむベントの発生時間の 倧小関係がどの皋床䞀臎しおいるかを衚す ▪ CI = 0.5 がランダム予枬、CI = 1.0 が完璧な予枬 分類および回垰の枠組みずの性胜比范 • 生存時間予枬の枠組みに則り停止の時間間隔を予枬する提案法が、 䜕日埌に停止するかどうか分類ず 停止日を盎接予枬する回垰ずどの皋床性胜差があるか比范 111 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (実隓)
  78. 結果 | 生存時間予枬を元にした手法の比范 • 埓来手法 vs. 提案手法 w/ 統蚈特城 &

    テキスト特城 ◩ DLを元にした手法が 10pt 以䞊の差を぀けお最良の結果を達成 ◩ DLモデルなので画像特城や時系列特城も考慮可胜 • 提案手法のベヌスラむン vs. フルモデル ◩ 短期・長期の停止を MTL で孊習させた提案手法のフルモデル は平均 3pt の予枬性胜の向䞊を確認 112 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (結果) All: すべおのデヌタを察象 Top 25% of sales: 売䞊の 25%以䞊を占める広告
  79. 結果 | 生存時間予枬を元にした手法の比范 • 埓来手法 vs. 提案手法 w/ 統蚈特城 &

    テキスト特城 ◩ DLを元にした手法が 10pt 以䞊の差を぀けお最良の結果を達成 ◩ DLモデルなので画像特城や時系列特城も考慮可胜 • 提案手法のベヌスラむン vs. フルモデル ◩ 短期・長期の停止を MTL で孊習させた提案手法のフルモデル は平均 3pt の予枬性胜の向䞊を確認 113 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (結果) All: すべおのデヌタを察象 Top 25% of sales: 売䞊の 25%以䞊を占める広告
  80. 結果 | N日埌の停止予枬を分類・回垰ず比范 短期モデルでは 40pt、長期モデルでは 60 pt の差を぀けおいる • 提案手法は分類・回垰ず比べお2倍以䞊の予枬性胜を実珟

    長期の停止予枬では分類や回垰の枠組みによる予枬は極めお難しい • 生存時間予枬により短期ず長期の停止の各特城を適切に考慮可胜 広告の停止予枬の性質ずしお (1) デヌタの極床な䞍均衡性、 (2) 広告停止の時間䟝存性 が存圚 • ほずんどの広告は早期に打ち切り停止がされるため、埓来の枠組みだず 偏った予枬しか出力されない可胜性あり • 生存時間予枬では時間が経過するほど停止予枬確率が高くなる傟向を モデリング可胜 ➜ 分類や回垰ではこうした仮定がモデルに含たれおいない 114 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (結果)
  81. 結果 | N日埌の停止予枬を分類・回垰ず比范 短期モデルでは 40pt、長期モデルでは 60 pt の差を぀けおいる • 提案手法は分類・回垰ず比べお2倍以䞊の予枬性胜を実珟

    長期の停止予枬では分類や回垰の枠組みによる予枬は極めお難しい • 生存時間予枬により短期ず長期の停止の各特城を適切に考慮可胜 広告の停止予枬の性質ずしお (1) デヌタの極床な䞍均衡性、 (2) 広告停止の時間䟝存性 が存圚 • ほずんどの広告は早期に打ち切り停止がされるため、埓来の枠組みだず 偏った予枬しか出力されない可胜性あり • 生存時間予枬では時間が経過するほど停止予枬確率が高くなる傟向を モデリング可胜 ➜ 分類や回垰ではこうした仮定がモデルに含たれおいない 115 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (結果) 分類・回垰に基づく長期モデル では停止しか出力されないこず があり、そのためF1スコアが 䜎くなっおいる可胜性
  82. 結論 | 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 効果の䜎くなった広告に察する新たな運甚支揎の枠組み提案 • 適切なタむミングを運甚者に説明可胜な圢で知らせる • 2぀の停止パタヌンを適切に捉えた停止支揎 泚意機構を元にした DL

    ベヌスの停止支揎モデル • 生存時間予枬を参考に、停止が発生するタむミングを ハザヌド関数でモデリングするこずで分類・回垰よりも良 広告の停止予枬に寄䞎するキヌワヌドを提瀺可胜 • 効果の䜎い広告を停止 するこずは 効果の高い広告を䜜成 する こずず同じぐらいビゞネスむンパクトあり ◩ 提案法は日々運甚者に停止予枬の結果ずその解釈を提䟛 実䞖界の運甚課題を泚意機構による解釈によっお支揎しおいる ➜ 第 6 章にお提案する枠組みの解釈性を議論 116 第5ç« : 泚意機構を元にした枠組みによる広告クリ゚むティブの停止予枬 (結論)
  83. 本研究成果の適甚範囲の議論 1/2 本研究を通じお NLP タスクを行う郚分に RNN モデルを䜿甚 • 研究開始圓初においお、既に幅広く実甚的に䜿甚されおいた •

    Transformer モデルに぀いおは適甚可胜ずだけ蚘茉 [Kitada+ 2021, 2022] Transformer モデルを䜿甚した評䟡を行わなかった理由 (1) 蚈算量の倧幅な増倧 ◩ 本研究で䜿甚した RNN ず比べお Transformer は局が深く パラメヌタ数が非垞倚いため圓時孊習が難しかった (2) Transformer における泚意機構の摂動に察する脆匱性の有無 ◩ Jain and Wallace [NAACL’19] では、埓来の RNN に おける泚意機構の脆匱性が報告されおいたずころに本研究では泚目 (3) Transformer における泚意の重みを甚いた予枬の解釈性 ◩ 䜿甚した RNN は最終局の手前に泚意機構があるため盎接予枬 に寄䞎する特城が泚意の重みに反映されおいるず考えおいた 118 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  84. 本研究成果の適甚範囲の議論 2/2 泚意機構に適甚可胜な提案法の Transformer ぞの応甚可胜性 • オリゞナルの AT/VAT 手法ず同様、提案法はモデルの正則化効果有 •

    BERT 等の事前孊習枈みモデルにおいおはモデルの重みを固定しお 提案法を適甚し、CLS トヌクンを甚いお予枬を行うこずが可胜 ➜ 埌続の研究で同様のアむディアが調査されおいるこずを議論 汎甚的な構成を有する広告運甚を支揎する枠組みに関する議論 • 本研究では泚意を有する RNN を甚いお運甚支揎の枠組みを構築 ◩ 提案する運甚支揎の枠組みは汎甚的であるため、広告テキストの凊理 を担うテキスト゚ンコヌダは Transformer に倉曎可胜 • 泚意 RNN の解釈性の研究は Transformer よりも倚く実瞟あり ➜ 成熟した技術が奜たれるビゞネスにおいおは利点が倚いず考えられる 119 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  85. 本研究における解釈性の議論 | 基瀎研究的偎面 1/2 第2ç« : 泚意に察しお敵察的孊習を適甚するこずにより、 泚意ず募配による重芁床の盞関が高くなった • “Attention is

    not explanation” ず指摘されたベヌスラむンモデル においおも、泚意ず募配のピア゜ン盞関は正の盞関を瀺す傟向 ◩ もずもず泚意ず募配は同様の解釈を䞀定の皋床䞎えおいた • 提案手法の効果により、タスクを予枬するのに重芁な単語に より泚意が圓たるようにモデルが孊習 ◩ 重芁そうな単語に募配が流れるこずで、ノむゞヌな募配がクリヌンに • 䞊蚘孊習で埗られた根拠箇所はタスクを解くために重芁な単語に 泚意・募配ずもに掻性化しおおり、人間にずっおも解釈しやすい 単語が遞ばれおいるず考えられる ➜ 第 3 章にお人手でアノテヌションされた根拠箇所ずの䞀臎床評䟡ぞ 120 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  86. 本研究における解釈性の議論 | 基瀎研究的偎面 2/2 第3ç« : 人手でアノテヌションされた根拠箇所ずの䞀臎床評䟡 • 提案法はベヌスラむンモデルよりも䞀臎床が高かった ◩ 人手によっお根拠ずしおラベル付けされた箇所はタスクを解くために

    十分な情報があり、”faithfulness” (忠実さ) の芳点から解釈性が高い ▪ “モデルが提䟛する説明は、圓該モデルが予枬を䞋すために実際に䜿甚し た情報を反映しおいれば、忠実であるず蚀える。” [Lipton Queue’18] 䞊蚘を螏たえ “Attention is not explanation” ず䞻匵された 泚意機構に察する解釈性に぀いお、我々は異なる結論を唱える • 䞻匵の元ずなった順䜍盞関による分析は必ずしも適切ずは蚀えない • 提案法によっお異なる解釈手法が同じ傟向の解釈を瀺すようになり 聞き手の理解を助ける信頌性の高い解釈を提䟛するこずが可胜に ◩ 泚意ず募配が同時に間違った根拠を瀺すこずも考えられる ▪ 解釈の信頌性を䞋げおしたうため、さらなる調査が必芁 121 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  87. 本研究における解釈性の議論 | 応甚研究的偎面 1/3 説明可胜 AI に求められる 有益性 [Arrieta+ Inf.

    Fusion’20] に焊点 • 適切な運甚の意思決定ができるように情報を提䟛するこずが重芁 ◩ 本研究で取り組んだ蚈算機広告分野の課題は倚くが人手に頌っおいる ➜ そもそも 倚くの課題は定匏化されおいない ◩ 広告運甚の諞問題をたず定匏化し初期的な解釈を提瀺しただけでも 孊術的・産業的に倧きな貢献であるず考えおいる • 配信効果の高い広告䜜成の支揎にあたり、ナヌザの興味を捉えた キヌワヌドを解釈可胜な圢で広告䜜成者や運甚者に提䟛可胜に ◩ 単玔な集蚈 (e.g., キヌワヌドずコンバヌゞョンの盞関) では 芋぀けられなかったものが倚い ➜ 提案する枠組みが 文脈や広告の属性を考慮可胜 であるため ◩ 提案法では売䞊に盎接寄䞎する魅力的な広告テキスト䜜成のために 広告䜜成者ぞ有益な解釈を提瀺するこずを可胜ずした 122 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  88. 本研究における解釈性の議論 | 応甚研究的偎面 2/3 配信効果が䜎い広告に察する 现かい単䜍の停止予枬による運甚者の意思決定支揎 • そもそも 広告の停止予枬ずいう課題に察しお、MLモデルを䜿っお 解決するずいう取り組み自䜓が孊術的に新しい

    ◩ 埓来の ML モデルによる意思決定支揎を行うこず自䜓が 新しく、運甚者の仕事や売䞊に倧きな圱響を䞎えるこずが可胜 ◩ 生存時間予枬の枠組みで、より詳现な予枬結果を提瀺可胜 ➜ 分類や回垰の枠組みでは郚分的な予枬しか提瀺ができず 運甚者が意思決定に必芁な詳现な予枬が提瀺できない • 運甚者は现かい単䜍での予枬結果を元に、停止の意思決定を 行うこずができるため、提案法は非垞に有益な運甚支揎を実珟 ◩ 有益性の高い説明可胜 AI の実珟 123 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  89. 本研究における解釈性の議論 | 応甚研究的偎面 3/3 配信効果が䜎い広告の停止支揎を行うにあたり 停止予枬に寄䞎するキヌワヌドを解釈可胜な圢で運甚者に提䟛 • 運甚者の経隓を元に停止を決められおいたものをDL モデルが その意思決定パタヌンを孊習するこずで停止パタヌンが顕圚化

    ◩ 短期: ナヌザが興味を瀺さなかった単語衚珟 ➜ 停止決定刀断に利甚されるが、すぐ停止されおしたう 効果の悪い広告の特城ずしおも捉えるこずが可胜で広告制䜜にも圱響 ◩ 長期: 旬ではなくなった時事的な単語衚珟 ➜ 長期で配信されおいるず流行に沿わなくなったキヌワヌド が含たれおおり、摩耗をより増長させる可胜性 • 情報公開の制玄のため本発衚では具䜓的な解釈性の評䟡は公開NG ◩ 䞀方で提案法は広告運甚者に日々予枬を提䟛しおおり、 泚意による解釈が停止業務を支揎しおいるこずは事実 ◩ ビゞネス的にも倧きな圱響ある業務に察しお適切な解釈を提䟛 124 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  90. 本研究が埌続に䞎えた圱響 | 基瀎研究的偎面 “泚意機構に察する敵察的孊習の導入” ずいうアむディアの圱響 • 時空間掚論における RoBERTa [Liu+ CoRR’19]

    (Transformer ベヌスモデル) に察する類䌌アむディアの適甚 [Pereira+ PACLIC’21, Pereira+ LREC’22] ◩ 埋め蟌みに AT/VAT を適甚するず同時に泚意にも適甚 ➜ ランダムに局を遞んで適甚するこずでモデルの汎化性胜向䞊 摂動に脆匱な泚意をより stable & explainable にする取り組み • 我々ず同様の動機から新たな泚意機構を提案 [Hu+ AAAI’23] ◩ 我々の手法を適甚した RNN や BERT 等で比范 我々のアむディアの制限: 敵察的摂動の蚈算による蚈算量の増倧 • 近幎の倧芏暡事前孊習モデルにおける事前孊習の段階での䜿甚では さらなる蚈算量の増倧ずなる点が難点 • Fine-tuning の段階で提案法を䜿甚するこずで郚分的に緩和 ◩ 少ないデヌタ数に察する孊習においお汎化性胜向䞊を期埅 125 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  91. 本研究が埌続に䞎えた圱響 | 応甚研究的偎面 比范的新しい蚈算機広告分野 における新たな副分野の開拓 • 広告クリ゚むティブに着目した 分析的な研究は以前より存圚 [Thomaidou+ DED&M’13,

    Thomaidou+ CIKM’13] ◩ 実際の運甚の立堎から問題解決する芳点は非垞に少ない 効果の高い広告クリ゚むティブに関する運甚支揎 • 運甚支揎に関しお我々を含めた研究が2019 幎ごろに登堎し始める ◩ 広告クリ゚むティブの䜜成支揎ずいう新たな研究の流れに 効果の䜎い広告クリ゚むティブに関する運甚支揎 • 埓来は広告クリ゚むティブの配信を担う手法で擬䌌的に停止を支揎 ◩ あくたで擬䌌的で停止タむミングの閟倀の蚭定は容易ではない ◩ 提案法はビゞネス䞊重芁な運甚を盎接支揎した初めおの研究 126 第6ç« : 議論 本研究成果の適甚範囲 > 本研究における解釈性 > 埌続研究に䞎えた圱響
  92. 128 発衚の流れ 第2ç«  [Kitada+ IEEE Access’21] 泚意機構に察する敵察的孊習 教垫あり孊習 第3ç«  [Kitada+

    Appl. Intell.’22] 泚意機構に察する仮想敵察的孊習 半教垫あり孊習 第4ç«  [Kitada+ KDD’19] 泚意機構を元にした枠組みによる 広告クリ゚むティブの効果予枬 第5ç«  [Kitada+ Appl. Sci.’22] 泚意機構を元にした枠組みによる 広告クリ゚むティブの停止予枬 第1ç«  導入 基瀎・応甚 研究の芳点からの泚意機構による予枬性胜・モデルの解釈可胜性の向䞊 第6ç«  結論 泚意機構を頑健にする手法の提案・実䞖界の倧芏暡デヌタによる有効性の実蚌 半教垫あり孊習 ぞ拡匵 広告入皿前ず埌 各運甚を支揎 効果の高い広告の 運甚支揎 倧量に埗られる ラベルなしデヌタ の有効掻甚 効果の䜎い広告の 運甚支揎
  93. 結論 | 基瀎・応甚 研究の芳点からの泚意機構による予枬性胜・モデルの解釈可胜性の向䞊 基瀎研究 の偎面 • 予枬性胜の向䞊 ◩ 昚今の

    DL モデルに広く利甚されおいる泚意機構の問題克服 ▪ 泚意機構におけるノむズ・摂動に察する脆匱性の解消 • 解釈性の向䞊 ◩ 耇数の根拠提瀺手法が同䞀の根拠を瀺すこずによる信頌性向䞊 ◩ 明確な泚意を孊習・提瀺するこずによるで容易な解釈を提瀺 応甚研究 の偎面 • 予枬性胜の向䞊 ◩ 蚈算機広告分野の運甚䞊の実問題を取り䞊げお定匏化 ▪ 泚意機構を取り入れ実䞖界の課題を高い粟床で予枬可胜に • 解釈性の向䞊 ◩ ビゞネス䞊重芁ずなる効果の高い広告の特城や、 効果の䜎い広告を停止する際に運甚者に根拠を提瀺 129 第7ç« : 結論
  94. 今埌の展望 基瀎研究からの偎面第2〜3章 • RNN ベヌスのモデルから、Transformer ベヌスのモデルぞ ◩ 泚意機構が䞀郚䜿われおいるモデルから、党䜓が泚意機構から 構成されおいるモデルにおける提案法の有効性確認 ◩

    Transformer ベヌスのモデルの解釈性確認やその性胜向䞊 応甚研究からの偎面第4〜5章 • 蚈算機広告分野以倖での泚意機構を有する DL モデルの実甚性評䟡 ◩ 情報怜玢や掚薊等の実甚的なドメむンでのさらなる有効性怜蚌 ▪ 䞊蚘の領域で実デヌタを甚いた怜蚌は未だに少ない ◩ ChatGPT [OpenAI’22] 等の察話を元にした実応甚手法ぞの着目 ▪ これたでずは完党に異なるパラダむムにおける “解釈性” の定矩やその性質の怜蚎 130 第7ç« : 結論
  95. 業瞟 | 原著論文査読付き 1. Shunsuke Kitada, Yuki Iwazaki, Riku Togashi,

    and Hitoshi Iyatomi. “DM2S2: Deep Multi-Modal Sequence Sets with Hierarchical Modality Attention,'' IEEE Access, vol. 10, pp. 120023-120034, 2022. 2. Shunsuke Kitada and Hitoshi Iyatomi. “Making attention mechanisms more robust and interpretable with virtual adversarial training,” Springer Applied Intelligence, 2022. (第3章に察応) 3. Shunsuke Kitada, Hitoshi Iyatomi, and Yoshifumi Seki. “Ad Creative Discontinuation Prediction with Multi-Modal Multi-Task Neural Survival Networks,” Applied Sciences 12.7, 2022. (第5章に察応) 4. Shunsuke Kitada and Hitoshi Iyatomi. “Attention meets perturbations: Robust and interpretable attention with adversarial training,” IEEE Access, vol. 9, pp 92974-92985, 2021. (第2章に察応) 131 付録
  96. 業瞟 | 囜際䌚議発衚査読付き 1. Ohata Kazuya, Shunsuke Kitada, and Hitoshi

    Iyatomi. “Feedback is Needed for Retakes: An Explainable Poor Image Notification Framework for the Visually Impaired,” Proc. of IEEE HONET, 2022. 2. Tsubasa Nakagawa, Shunsuke Kitada, and Hitoshi Iyatomi. “Expressions Causing Differences in Emotion Recognition in Social Networking Service Documents,” Proc. of CIKM, 2022. 3. Takumi Aoki, Shunsuke Kitada, and Hitoshi Iyatomi. “Text Classification through Glyph-aware Disentangled Character Embedding and Semantic Sub-character Augmentation,” Proc. of AACL-IJCNLP SRW, 2020. 4. Mahmoud Daif, Shunsuke Kitada, and Hitoshi Iyatomi. “AraDIC: Arabic Document Classification Using Image-Based Character Embeddings and Class-Balanced Loss,” Proc. of ACL SRW, 2020 132 付録
  97. 業瞟 | 囜際䌚議発衚査読付き 5. Shunsuke Kitada, Hitoshi Iyatomi, and Yoshifumi

    Seki. “Conversion prediction using multi-task conditional attention networks to support the creation of effective ad creatives,” Proc. of KDD, 2019. (第4章に察応) 6. Shunsuke Kitada, Ryunosuke Kotani, and Hitoshi Iyatomi. “End-to-end text classification via image-based embedding using character-level networks,” Proc. of IEEE AIPRW, 2018. 133 付録
  98. 業瞟 | 受賞 および 研究費獲埗 受賞 1. NLP 若手の䌚 第

    14 回シンポゞりム 奚励賞 受賞2019幎8月28日 2. 情報凊理孊䌚 第 81 回党囜倧䌚 孊生奚励賞 受賞2019幎3月15日 134 付録 研究費 • JSPS KAKENHI 21J14143 (特別研究員奚励費). “摂動に頑健で解釈 可胜な深局孊習モデルの開発ずその解釈性の評䟡”