_2023__工家_Web研究用スライド.pdf

0 手続き的知識源を用いた方法を表すクエリからの目的抽出兵庫県立大学工家昂之兵庫県立大学山本岳洋青山学院大学
莊司慶行 3a-2-2 DEIM 2023 3月5日

1 ▪ ある目的の達成方法は複数ある ▪ 例，「雪道を自動車で走る」目的では以下の解決方法背景自動車＋滑り止めわだち
＋走り方車のタイヤ＋チェーンを巻く方法雪道を自動車で走る方法目的

2 ▪ 複数ある解決方法の全ては知っていない ▪ 既存の検索システムはクエリに関する情報を提示 ▪ ユーザがクエリにできない方法は検索できない背景自動車＋
滑り止めわだち＋走り方車のタイヤ＋チェーンを巻く方法発見できない雪道を自動車で走る方法目的未知の方法がユーザにとって最適な可能性がある

3 ▪ システムが多様な未知の方法を提示し選択肢を増やす ▪ 方法を表すクエリから目的を抽出する研究目的自動車＋滑り止め ①
② わだち＋走り方車のタイヤ＋チェーンを巻く方法雪道を自動車で走る方法目的 ①:目的の抽出（本研究の取り組み） ②:目的を達成可能な方法を検索

4 ▪ クエリ修正前後のクエリの関係を分類した研究[1] 関連研究 [1] Paolo Boldi; Francesco Bonchi; Carlos
Castillo; Sebastiano Vigna, From “Dango” to “Japanese Cakes” :Query Reformulation Models and Patterns, 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology, pp. 183- 190, 2009 果物リンゴ特化汎化本研究が実現したいこと車のタイヤにチェーンを巻く雪道を自動車で走る方法上位語置き換えやキーワード削除で実現できない特化汎化

5 ▪ 文生成モデルのファインチューニング ▪ BERT2BERT ▪ T5 提案手法 Encoder Decoder
入力（方法）出力（目的）油性を消す方法 ... ペン油性を消す方法ペン ... 文生成モデル [bos] ペンを方法油性 ... ... ... ...

6 ▪ Text-To-Text Transfer Transformer（T5） ▪ 自然言語処理タスクを自然言語で解くモデル T5 Colin Raffel,
Noam Shazeer, Adam Roberts, Katherine Lee,Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, Peter J Liu, et al. Exploring the limits of transfer learning with a unified text-to-text transformer. Journal of Machine Learning Research, Vol. 21, No. 140, pp. 1–67, 2020. 自然言語出力入力自然言語

7 ▪ 事前学習済みBERTのパラメータを初期値に利用 BERT2BERT Sascha Rothe, Shashi Narayan, and Aliaksei
Severyn.Leveragingpre-trained checkpoints for sequence generation tasks.Transactions of the Association for Computational Linguistics,Vol. 8, pp. 264–280, 2020. BERT BERT 入力（方法）出力（目的）油性を消す方法 ... ペン油性を消す方法ペン ... BERT2BERT [bos] ペンを方法油性 ... ... ... ...

8 ▪ 提案手法には大規模データセットが必要 ▪ 方法と目的が対のデータ ▪ 既存データセットが存在しない課題 Encoder Decoder
入力（方法）出力（目的）油性を消す方法 ... ペン油性を消す方法ペン ... 文生成モデル [bos] ペンを方法油性 ... ... ... ... このペアが大量に必要

9 ▪ 方法と目的が対のデータセット作成 ▪ 人手で構築すると時間がかかる訓練データ構築データセットを自動で作成

10 ▪ wikiHowは手続き的知識源のまとめサイト ▪ wikiHowを手続き的知識源として利用できる ▪ 何かをする際のやり方に関する知識 wikiHowからの訓練データ構築〇〇する方法１．方法1
２．方法2 ３．方法3 ：：出力入力１入力２入力３ wikiHowの構造実際のページ[2] [2]https://www.wikihow.jp/%E5%A7%BF%E5%8B%A2%E3%82%92%E8%89%AF%E3%81%8F%E3%81%99%E3%82%8B

11 ▪ クローリングでデータを収集 ▪ タイトルを出力，見出しを入力に ▪ 訓練データを自動的に構築 wikiHowデータセット入力出力
良い姿勢で立つ，歩く姿勢を良くする方法良い姿勢で座る姿勢を良くする方法良い姿勢で寝る姿勢を良くする方法 [2]https://www.wikihow.jp/%E5%A7%BF%E5%8B%A2%E3%82%92%E8%89%AF%E3%81%8F%E3%81%99%E3%82%8B

12 ▪ 入力（方法）に対して結果が目的になっている ▪ 両モデルで生成結果が異なる場合もある ▪ 例では両方の出力が入力の目的として妥当生成結果出力例入力（方法）
生成結果（目的） BERT2BERT T5 具体的な筋書きと台本を作る脚本を書く脚本を書くテントを買う夏休み中の暇をつぶすキャンプをする

13 ▪ 1つの入力に対して複数の生成ができる ▪ 正解である可能性が高い順にランキング ▪ 類似の生成結果が連続する文生成モデルによる生成類似している順位
出力 1 コーヒーを飲む方法 2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：入力が「いい姿勢で立つ，歩く」

14 ▪ 上位に不正解が連続して並ぶ ▪ 下位結果に正解が存在する場合 ▪ ランキング評価が低下文生成モデルによる生成不正解順位
出力 1 コーヒーを飲む方法 2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：入力が「いい姿勢で立つ，歩く」正解

15 ▪ 生成結果のランキングを多様化 ▪ 高順位＆既選出結果と非類似結果の選出多様化多様化前多様化後順位出力
1 コーヒーを飲む方法 2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：順位出力

16 ▪ 1番目は最上位生成結果多様化多様化前多様化後順位出力 1 コーヒーを飲む方法
2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：順位出力 1番目は最上位生成結果を選ぶ

17 ▪ 1番目は最上位生成結果多様化多様化前多様化後順位出力 1 コーヒーを飲む方法
2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：順位出力 1 コーヒーを飲む方法 1番目は最上位生成結果を選ぶ

18 ▪ 1番目と似ていない生成結果を選ぶ多様化多様化前多様化後順位出力 1 コーヒーを飲む方法
2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：順位出力 1 コーヒーを飲む方法 1番目と似ている

2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：順位出力 1 コーヒーを飲む方法 1番目と似ている

2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：順位出力 1 コーヒーを飲む方法 2 姿勢を良くする方法 4の「姿勢を良くする方法」を選ぶ

2 コーヒーを作って飲む 3 コーヒーを淹れる 4 姿勢を良くする方法 : ：順位出力 1 コーヒーを飲む方法 2 姿勢を良くする方法下位にある正解を上位へと移動できた

22 ▪ Maximal Marginal Relevance（MMR） ▪ 文間の類似度の計算にはSentenceBERTを使う ▪ SentenceBERTは文の類似度をベクトルで表現 ▪
コサイン類似度により類似度を計算多様化 𝒅𝒓 = 𝐚𝐫𝐠𝐦𝐚𝐱 𝝀𝑹 − 𝟏 − 𝝀 𝐦𝐚𝐱 𝐬𝐢𝐦 (𝒅, 𝒅′) 𝒅 ∈ 𝑫 ∖ 𝑺𝒓−𝟏 𝒅′ ∈ 𝑺𝒓−𝟏 𝒓位にランキングされる生成結果を決定する 𝑫：文集合 𝑺𝒓−𝟏：すでにランキングされた文集合 𝑹：生成結果の順位の逆数 𝐬𝐢𝐦：文間の類似度 𝝀：定数（𝝀 ∈ [𝟎, 𝟏] ,本研究では𝝀 = 𝟎. 𝟓）

23 ▪ Maximal Marginal Relevance（MMR） ▪ 文間の類似度の計算にはSentenceBERTを使う ▪ SentenceBERTは文の類似度をベクトルで表現 ▪
コサイン類似度により類似度を計算多様化 𝑫：文集合 𝑺𝒓−𝟏：すでにランキングされた文集合 𝑹：生成結果の順位の逆数 𝐬𝐢𝐦：文間の類似度 𝝀：定数（𝝀 ∈ [𝟎, 𝟏] ,本研究では𝝀 = 𝟎. 𝟓） 𝒅𝒓 = 𝐚𝐫𝐠𝐦𝐚𝐱 𝝀𝑹 − 𝟏 − 𝝀 𝐦𝐚𝐱 𝐬𝐢𝐦 (𝒅, 𝒅′) 𝒅 ∈ 𝑫 ∖ 𝑺𝒓−𝟏 𝒅′ ∈ 𝑺𝒓−𝟏 𝒓位にランキングされる生成結果を決定する順位が高いかつ既に選んだ結果と似ていない結果を選ぶ

24 ▪ 下記手法について比較する ▪ T5（多様化あり） ▪ T5（多様化なし） ▪ BERT2BERT（多様化あり） ▪
BERT2BERT（多様化なし） ▪ T5とBERT2BERTについて比較 ▪ 多様化前後のランキングついて比較評価実験

25 ▪ 訓練データセット ▪ 日本語版wikiHowよりクローリングで収集 ▪ 1,685ページ，4,977件の手続き的知識源 ▪ 訓練/検証/テスト：4,480/249/248 データセット

26 ▪ 事前学習済みモデル ▪ T5（sonoisa/t5-base-japanese） ▪ BERT2BERT（東北大学の事前学習済みモデル） ▪ 学習の設定 ▪
学習率 ▪ T5：3.0×10-4 ▪ BERT2BERT：2.0×10-6 ▪ 損失関数：交差エントロピー ▪ 最適化関数：Adam Weight Decay ▪ バッチサイズ：256 ▪ 最大トークン数：32 ▪ 早期終了によりエポック数を決定学習条件

27 ▪ 自動評価 ▪ BERTScoreで正解との類似度を数値化 ▪ 人手評価 ▪ 生成結果が入力の目的かを0,1で評価 ▪
データセットから30件選び評価評価尺度

28 ▪ BERTScore は文章の類似度を計算する ▪ 翻訳や要約の評価に用いられる ▪ 文のベクトル表現にBERTモデルを使っている ▪ 今回使用するモデル
▪ bert-base-multilingual-cased BERTScore 比較対象比較する文スコア今日の昼食は餃子でした好きなゲームはポケモンです 0.715 今日の昼食は餃子でした昼食に餃子を食べました 0.806 実際のBERTScoreでの値

29 ▪ wikiHowデータセットのテストデータでの評価 ▪ 最上位生成結果のみを評価 ▪ 表の値はテストデータ248件の平均BERTScore 自動評価結果 T5が優れている BERT2BERT
T5 0.808 0.826

30 ▪ 生成結果上位100件のBERTScoreを評価する ▪ しきい値以上のBERTScorを正解とみなす ▪ テストデータ248件の平均逆順位を計算（MRR）ランキングの自動評価コーヒーを飲む方法コーヒーを淹れる
炒飯の作り方：： 0.769154 0.844105 0.618718 ：：姿勢を良くする方法 0.907411 BERTScore A:姿勢を良くする方法 0 0 1 0 ：： RR：0.333 例，しきい値が0.9のとき

31 ▪ しきい値を超えるBERTScoreを正解とみなす ▪ テストデータ248件の平均逆順位（MRR） ▪ しきい値を0.7～1.0の間で変化自動評価結果（ランキング） T5 BERT2BERT
BERT2BERT（多様化） T5（多様化なし）が優れている T5（多様化）

32 ▪ wikiHowより作成したテストデータで評価 ▪ 0,1で評価後DCG@10,P@10を計算人手評価結果 BERT2BERT T5 評価手法 MMRなし
MMRあり MMRなし MMRあり DCG@10 1.21 0.810 1.28 0.998 P@10 0.210 0.117 0.223 0.160 T5（多様化なし）が優れている

33 ▪ wikiHowに存在しないクエリに対応できるか？ ▪ モデルの汎化能力の確認する必要がある ▪ wikiHowにない方法と目的のペアを作成汎化能力の検証自作のデータセットによるテストを行う

34 ▪ wikiHowには存在しないクエリ ▪ 自作した100件のテストデータセット ▪ モデルの汎化能力の確認に用いる自作データセット実際のデータ入力（方法）
出力（目的）無駄遣いを減らす方法貯金する方法ヘアワックスの使い方寝癖を直す方法自炊する方法食費を節約する方法牛乳を飲む方法牛乳嫌いを克服する方法甘いカレーを作る方法子供用のカレーを作る方法

35 ▪ 自作データセットを用いた評価 ▪ 評価方法はwikiHowデータセットと同じ自動評価結果 BERT2BERT T5 0.733 0.739
T5が優れている T5（多様化なし）が優れている

36 ▪ 自作したテストデータで評価 ▪ 評価方法はwikiHowデータセットと同じ人手評価結果 BERT2BERT T5 評価手法 MMRなし
MMRあり MMRなし MMRあり DCG@10 0.203 0.156 0.290 0.239 P@10 0.0300 0.0200 0.0533 0.0467 T5（多様化なし）が優れている

37 ▪ BERT2BERTとT5ではT5の方が高いBERTScore ▪ 多様化前の方が正解が上位に存在 ▪ 正解が多様化で下位に移動してしまう ▪ 2種類のデータセットのテストデータで評価 ▪
どちらもT5が優れた評価となった結果

38 ▪ 手続き的知識源を用いた方法を表すクエリからの目的抽出 ▪ まとめ ▪ 様々な方法について情報を得たい ▪ ユーザの入力から目的を抽出する
▪ 文生成モデルのファインチューニング ▪ 手続き的知識源利用した訓練データ自動構築 ▪ 結果について ▪ T5（多様化なし）が優れている ▪ 今後の課題 ▪ キーワードクエリ ▪ 実際にほかの方法を提案するまとめ

_2023__工家_Web研究用スライド.pdf

_2023__工家_Web研究用スライド.pdf

More Decks by 兵庫県立大学 山本研究室

Featured

Transcript

More Decks by 兵庫県立大学山本研究室