Slide 1

Slide 1 text

特定選手に注目した試合結果記事 見出しのパーソナライズ 佐々木泰河、工家昂之、山本岳洋(兵庫県立大学) 莊司慶行(静岡大学) 2024年2月29日 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024) T1-B-6-04

Slide 2

Slide 2 text

見出しによる情報の見逃し 2 ニュース一覧 ・西の好投で連敗ストップ ・大山猛打賞で阪神2連勝 大山選手に注目した見出しを生成できれば情報の見逃しを 防ぐことができる。 大山ファン 大山に言及していない見出しの記事をクリック しないと大山に関する情報を見逃してしまう。 記事の中身には 大山の活躍についての 記述がある可能性

Slide 3

Slide 3 text

パーソナライズした見出し 3 阪神が逆転勝利で連敗を3で止めた。~ ~ ~ ~ ~ ~ 大山の9号2ラン が飛び出した。~ ~ ~ ~ ~ ここで木浪が起死回生の逆転タイムリーを 放つ。~ ~ ~ ~ ~ ~ ~ で阪神 連敗ストップ 大山ファン向け見出し で阪神 逆転勝ち 木浪ファン向け見出し 試合結果記事 大山の9号2ラン が飛び出した。 大山9号2ラン ここで木浪が起死回生の逆転タイムリーを 放つ。 木浪タイムリー

Slide 4

Slide 4 text

メリット 4 読者のメリット • 自分が好きな選手の情報を 見逃しにくい。 記事作成者のメリット • より多くのクリック数を稼げる。

Slide 5

Slide 5 text

文生成モデル 5 テキスト 大規模 言語モデル 入力 出力 テキスト タスク • 質問応答 • 翻訳 • 要約 モデル • GPT • BERT2BERT • T5

Slide 6

Slide 6 text

文生成モデル 6 テキスト 大規模 言語モデル 入力 出力 テキスト タスク • 質問応答 • 翻訳 • 要約 モデル • GPT • BERT2BERT • T5

Slide 7

Slide 7 text

T5 7 ・Transformerを利用したEncoder-Decoderモデル ・入力と出力は常にテキスト ・ファインチューニングにより特定のタスクを 解かせることができる。 テキスト T5 入力 出力 テキスト

Slide 8

Slide 8 text

提案手法:重要文のみを入力 8 記事全文 + 注目する選手名 記事の主題に関す る文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入 力 T5 入力文の作成 余計な情報の排除!!

Slide 9

Slide 9 text

記事全文を入力する問題点 9 記事全文 入力 見出し T5 出力 注目選手以外の活躍の情報を使って、事実と 異なる見出しが生成される可能性。

Slide 10

Slide 10 text

記事全文を入力する問題点 10 阪神が逆転勝利で連敗を3で止めた。~ ~ ~ ~ ~ ~ 大山の9号2ラン が飛び出した。~ ~ ~ ~ ~ ここで木浪が起死回生の逆転タイムリーを 放つ。~ ~ ~ ~ ~ ~ ~ で阪神 連敗ストップ 大山ファン向け見出し 試合結果記事 大山の9号2ラン が飛び出した。 大山タイムリー ここで木浪が起死回生の逆転タイムリーを 放つ。

Slide 11

Slide 11 text

提案手法:生成後の処理 11 T5 注目した選手名 を含む見出し 出力 注目した選手名を 含まない見出し 注目した選手名 を含む見出し 注目した選手名を 含まない見出し 100個 ビームサーチ を利用!

Slide 12

Slide 12 text

提案手法:生成後の処理 12 T5 注目した選手名 を含む見出し 出力 注目した選手名を 含まない見出し 注目した選手名 を含む見出し 注目した選手名を 含まない見出し 100個

Slide 13

Slide 13 text

抽出対象の重要文 13 記事全文 + 注目する選手名 記事の主題に 関する文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入力文の作成 記事の主題に関する文 • 記事の最初の文 • 記事の最初の文には、主題が書かれることが 多いため • 本物の見出しと類似度が高い文(similarityが3以上) • 本物の見出しは、筆者が記事の主題を読者に 素早く伝える目的で作成したものであるため

Slide 14

Slide 14 text

抽出対象の重要文 14 記事全文 + 注目する選手名 記事の主題に 関する文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入力文の作成 注目選手の活躍に関する文 • 注目選手の名前が含まれる文 • 選手の活躍を述べる文には、選手名 が入っていることが多いため

Slide 15

Slide 15 text

抽出対象の重要文 15 記事全文 + 注目する選手名 記事の主題に 関する文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入力文の作成 記事の主題に関する文 • 記事の最初の文 • 記事の最初の文には、主題が書かれることが多いため • 本物の見出しと類似度が高い文(similarityが3以上) • 本物の見出しは、筆者が記事の主題を読者に素早く伝える目的で作 成したものであるため 注目選手の活躍に関する文 • 注目選手の名前が含まれる文 • 選手の活躍を述べる文には、選手名が入っていることが多いため

Slide 16

Slide 16 text

抽出文決定のための類似度の計算方法 16 本物の見出し 阪神が打線爆発で連敗ストップ!1試合で首位返り咲き 高卒2年目の前川がプロ初猛打賞で牽引 中日戦6連勝 記事本文(ある日の試合結果記事) 阪神は打線が爆発し、2桁11得点の猛攻で連敗を「5」でストップさせた。 0・5ゲーム差で首位だったDeNAが敗れたため、1試合で首位に返り咲 いた。0-0の三回にビッグイニングを作った。先頭・梅野が中前打を放 ち、その後1死二、三塁と好機を作ると、近本の右犠飛で先取点をゲット。 さらに中野&前川の連続適時打で3点を奪った。なおも2死一塁で、大 山が左越え9号2ランをマーク。この回に一挙5点を挙げた。2点差に迫 られた五回には、先頭・前川が中越え三塁打をマーク。その後、1死満 塁の絶好機で梅野の平凡な打球を三塁・石川がファンブルして、その間 に1点を追加。続く木浪が中前2点適時打を放ち、再びリードを広げた。 終盤にも着実に加点し、前川がプロ初の猛打賞をマークした。先発の西 勇は5回7安打3失点で今季5勝目を挙げた。 クエリ 文書1 文書2 文書3 文書4 文書5 文書6 文書7 文書8 文書9 文書10 文書11 文書12

Slide 17

Slide 17 text

抽出文決定のための類似度の計算過程 17 本物の見出し 阪神が打線爆発で連敗ストップ!1試合で首位返り咲き 高卒2年目の前川がプロ初猛打賞で牽引 中日戦6連勝 類似度を計算する文 0・5ゲーム差で首位だったDeNAが敗れたため、 1試合で首位に返り咲いた。

Slide 18

Slide 18 text

形態素の抽出 18 本物の見出し 阪神/が/打線/爆発/で/連敗/ストップ/!/1/試合/で/首位/返り咲き/ 高卒/2/年/目/の/前川/が/プロ/初/猛/打/賞/で/牽引/ 中日/戦/6/連勝 類似度を計算する文 0/・/5/ゲーム/差/で/首位/だ/っ/た/DeNA/が/敗れ/た/ ため/、/1/試合/で/首位/に/返り咲い/た/ Mecabを利用し、 助詞と数値以外の形態素を抽出

Slide 19

Slide 19 text

共起している形態素の抽出 19 阪神 打線 爆 発 連敗 ストッ プ ! 返り咲き 高 卒 年 目 前川 プロ 初 猛 打 賞 牽引 中日 戦 連勝 ・ ゲーム 差 首位 DeNA 敗 れ 返り咲い 試合 首位 本物の見出し 類似度を計算する文 共起した形態素のIDFの 合計値により類似度を計算!

Slide 20

Slide 20 text

IDFを利用する理由 20 爆発 ストップ 試合 首位 ・・・ 中前 打 回 文書1 1 1 0 0 ・・・ 0 0 0 文書2 0 0 1 1 ・・・ 0 0 0 文書3 0 0 0 0 ・・・ 0 0 1 文書4 0 0 0 0 ・・・ 1 1 0 文書5 0 0 0 0 ・・・ 0 1 0 文書6 0 0 0 0 ・・・ 0 0 0 文書7 0 0 0 0 ・・・ 0 0 1 文書8 0 0 0 0 ・・・ 0 0 1 文書9 0 0 0 0 ・・・ 0 0 0 文書10 0 0 0 0 ・・・ 1 1 0 文書11 0 0 0 0 ・・・ 0 1 0 文書12 0 0 0 0 ・・・ 0 0 1 記事の中であまり登場しない形態素が本物の見出し と共起することの価値を上げるのが目的

Slide 21

Slide 21 text

IDFを利用する理由(具体例) 21 爆発 ストップ 試合 首位 ・・・ 中前 打 回 文書1 1 1 0 0 ・・・ 0 0 0 文書2 0 0 1 1 ・・・ 0 0 0 文書3 0 0 0 0 ・・・ 0 0 1 文書4 0 0 0 0 ・・・ 1 1 0 文書5 0 0 0 0 ・・・ 0 1 0 文書6 0 0 0 0 ・・・ 0 0 0 文書7 0 0 0 0 ・・・ 0 0 1 文書8 0 0 0 0 ・・・ 0 0 1 文書9 0 0 0 0 ・・・ 0 0 0 文書10 0 0 0 0 ・・・ 1 1 0 文書11 0 0 0 0 ・・・ 0 1 0 文書12 0 0 0 0 ・・・ 0 0 1

Slide 22

Slide 22 text

IDFを利用する理由(具体例) 22 爆発 ストップ 試合 首位 ・・・ 中前 打 回 文書1 1 1 0 0 ・・・ 0 0 0 文書2 0 0 1 1 ・・・ 0 0 0 文書3 0 0 0 0 ・・・ 0 0 1 文書4 0 0 0 0 ・・・ 1 1 0 文書5 0 0 0 0 ・・・ 0 1 0 文書6 0 0 0 0 ・・・ 0 0 0 文書7 0 0 0 0 ・・・ 0 0 1 文書8 0 0 0 0 ・・・ 0 0 1 文書9 0 0 0 0 ・・・ 0 0 0 文書10 0 0 0 0 ・・・ 1 1 0 文書11 0 0 0 0 ・・・ 0 1 0 文書12 0 0 0 0 ・・・ 0 0 1 「打」、「回」より 「爆発」、「ストップ」が 共起することの価値を 上げたい!!

Slide 23

Slide 23 text

形態素tのIDFの計算式 23 idft = log(sentences freq +𝑛 ) • freqは形態素tが現れる文の数 • sentencesは対象記事の文の数 • 今回は10で固定 • nは定数 • 値を大きくすると現れることが少ない形態素の 価値が向上 • 今回は5を代入

Slide 24

Slide 24 text

IDF値の合計を計算 24 阪神 打線 爆 発 連敗 ストッ プ ! 返り咲き 高 卒 年 目 前川 プロ 初 猛 打 賞 牽引 中日 戦 連勝 ・ ゲーム 差 首位 DeNA 敗 れ 返り咲い 試合 首位 本物の見出し 類似度を計算する文 形態素 IDF値 試合 0.51 首位 0.51 0.51 + 0.51 = 1.02

Slide 25

Slide 25 text

IDF値の合計を計算する式 25 idfsum = σ𝑖=1 𝑘 idfti • kは共起している形態素の数 •idfti は形態素tのIDF値 形態素 IDF値 試合 0.51 首位 0.51 0.51 + 0.51 = 1.02

Slide 26

Slide 26 text

Similarityを計算する式 26 similarity = 𝛼 ∗ idfsum − 𝛽 ∗ morphemes • 長い文にペナルティを与えている。 • idfsum はIDFの合計値 • morphemesは現在類似度を計算している文の形態素の数 • 𝛼, 𝛽は重視する値を調節するパラメータ • 今回は𝛼に5,𝛽に0.1を代入 • similarityが3以上のとき抽出対象となる。 ・ ゲーム 差 首位 DeNA 敗れ 返り咲い 類似度を計算する文 試合 首位 similarity = 5 ∗ 1.02 − 0.1 ∗ 9 = 4.20 ≥ 3

Slide 27

Slide 27 text

大山選手に注目 27 本文 similarity 阪神は打線が爆発し、2桁11得点の猛攻で連敗を「5」でストップさせた。 11.95 0・5ゲーム差で首位だったDeNAが敗れたため、1試合で首位に返り咲いた。 4.20 0-0の三回にビッグイニングを作った。 -0.60 先頭・梅野が中前打を放ち、その後1死二、三塁と好機を作ると、近本の右犠飛で先取点をゲット。 -1.15 さらに中野&前川の連続適時打で3点を奪った。 0.85 なおも2死一塁で、大山が左越え9号2ランをマーク。 -0.90 この回に一挙5点を挙げた。 -0.40 2点差に迫られた五回には、先頭・前川が中越え三塁打をマーク。 0.00 その後、1死満塁の絶好機で梅野の平凡な打球を三塁・石川がファンブルして、その間に1点を追加。 -1.50 続く木浪が中前2点適時打を放ち、再びリードを広げた。 -0.55 終盤にも着実に加点し、前川がプロ初の猛打賞をマークした。 10.85 先発の西勇は5回7安打3失点で今季5勝目を挙げた。 1.55

Slide 28

Slide 28 text

抽出対象の重要文 28 記事全文 + 注目する選手名 記事の主題に 関する文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入力文の作成 記事の主題に関する文 • 記事の最初の文 • 記事の最初の文には、主題が書かれることが多いため • 本物の見出しと類似度が高い文(similarityが3以上) • 本物の見出しは、筆者が記事の主題を読者に素早く伝える目的で作 成したものであるため 注目選手の活躍に関する文 • 注目選手の名前が含まれる文 • 選手の活躍を述べる文には、選手名が入っていることが多いため

Slide 29

Slide 29 text

抽出対象の重要文 29 記事全文 + 注目する選手名 記事の主題に 関する文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入力文の作成 記事の主題に関する文 • 記事の最初の文 • 記事の最初の文には、主題が書かれることが多いため • 本物の見出しと類似度が高い文(similarityが3以上) • 本物の見出しは、筆者が記事の主題を読者に素早く伝える目的で作 成したものであるため 注目選手の活躍に関する文 • 注目選手の名前が含まれる文 • 選手の活躍を述べる文には、選手名が入っていることが多いため

Slide 30

Slide 30 text

抽出対象の重要文 30 記事全文 + 注目する選手名 記事の主題に 関する文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入力文の作成 記事の主題に関する文 • 記事の最初の文 • 記事の最初の文には、主題が書かれることが多いため • 本物の見出しと類似度が高い文(similarityが3以上) • 本物の見出しは、筆者が記事の主題を読者に素早く伝える目的で作 成したものであるため 注目選手の活躍に関する文 • 注目選手の名前が含まれる文 • 選手の活躍を述べる文には、選手名が入っていることが多いため

Slide 31

Slide 31 text

抽出対象の重要文 31 記事全文 + 注目する選手名 記事の主題に 関する文の抽出 注目選手の活躍に 関する文の抽出 抽出した 文の集合 入力文の作成 記事の主題に関する文 • 記事の最初の文 • 記事の最初の文には、主題が書かれることが多いため • 本物の見出しと類似度が高い文(similarityが3以上) • 本物の見出しは、筆者が記事の主題を読者に素早く伝える目的で作 成したものであるため 注目選手の活躍に関する文 • 注目選手の名前が含まれる文 • 選手の活躍を述べる文には、選手名が入っていることが多いため

Slide 32

Slide 32 text

記事の最初の文 32 本文 similarity 阪神は打線が爆発し、2桁11得点の猛攻で連敗を「5」でストップさせた。 11.95 0・5ゲーム差で首位だったDeNAが敗れたため、1試合で首位に返り咲いた。 4.20 0-0の三回にビッグイニングを作った。 -0.60 先頭・梅野が中前打を放ち、その後1死二、三塁と好機を作ると、近本の右犠飛で先取点をゲット。 -1.15 さらに中野&前川の連続適時打で3点を奪った。 0.85 なおも2死一塁で、大山が左越え9号2ランをマーク。 -0.90 この回に一挙5点を挙げた。 -0.40 2点差に迫られた五回には、先頭・前川が中越え三塁打をマーク。 0.00 その後、1死満塁の絶好機で梅野の平凡な打球を三塁・石川がファンブルして、その間に1点を追加。 -1.50 続く木浪が中前2点適時打を放ち、再びリードを広げた。 -0.55 終盤にも着実に加点し、前川がプロ初の猛打賞をマークした。 10.85 先発の西勇は5回7安打3失点で今季5勝目を挙げた。 1.55

Slide 33

Slide 33 text

本物の見出しと類似度が高い文 33 本文 similarity 阪神は打線が爆発し、2桁11得点の猛攻で連敗を「5」でストップさせた。 11.95 0・5ゲーム差で首位だったDeNAが敗れたため、1試合で首位に返り咲いた。 4.20 0-0の三回にビッグイニングを作った。 -0.60 先頭・梅野が中前打を放ち、その後1死二、三塁と好機を作ると、近本の右犠飛で先取点をゲット。 -1.15 さらに中野&前川の連続適時打で3点を奪った。 0.85 なおも2死一塁で、大山が左越え9号2ランをマーク。 -0.90 この回に一挙5点を挙げた。 -0.40 2点差に迫られた五回には、先頭・前川が中越え三塁打をマーク。 0.00 その後、1死満塁の絶好機で梅野の平凡な打球を三塁・石川がファンブルして、その間に1点を追加。 -1.50 続く木浪が中前2点適時打を放ち、再びリードを広げた。 -0.55 終盤にも着実に加点し、前川がプロ初の猛打賞をマークした。 10.85 先発の西勇は5回7安打3失点で今季5勝目を挙げた。 1.55

Slide 34

Slide 34 text

大山選手の活躍に関する文 34 本文 similarity 阪神は打線が爆発し、2桁11得点の猛攻で連敗を「5」でストップさせた。 11.95 0・5ゲーム差で首位だったDeNAが敗れたため、1試合で首位に返り咲いた。 4.20 0-0の三回にビッグイニングを作った。 -0.60 先頭・梅野が中前打を放ち、その後1死二、三塁と好機を作ると、近本の右犠飛で先取点をゲット。 -1.15 さらに中野&前川の連続適時打で3点を奪った。 0.85 なおも2死一塁で、大山が左越え9号2ランをマーク。 -0.90 この回に一挙5点を挙げた。 -0.40 2点差に迫られた五回には、先頭・前川が中越え三塁打をマーク。 0.00 その後、1死満塁の絶好機で梅野の平凡な打球を三塁・石川がファンブルして、その間に1点を追加。 -1.50 続く木浪が中前2点適時打を放ち、再びリードを広げた。 -0.55 終盤にも着実に加点し、前川がプロ初の猛打賞をマークした。 10.85 先発の西勇は5回7安打3失点で今季5勝目を挙げた。 1.55

Slide 35

Slide 35 text

大山選手に注目 35 本文 similarity 阪神は打線が爆発し、2桁11得点の猛攻で連敗を「5」でストップさせた。 11.95 0・5ゲーム差で首位だったDeNAが敗れたため、1試合で首位に返り咲いた。 4.20 0-0の三回にビッグイニングを作った。 -0.60 先頭・梅野が中前打を放ち、その後1死二、三塁と好機を作ると、近本の右犠飛で先取点をゲット。 -1.15 さらに中野&前川の連続適時打で3点を奪った。 0.85 なおも2死一塁で、大山が左越え9号2ランをマーク。 -0.90 この回に一挙5点を挙げた。 -0.40 2点差に迫られた五回には、先頭・前川が中越え三塁打をマーク。 0.00 その後、1死満塁の絶好機で梅野の平凡な打球を三塁・石川がファンブルして、その間に1点を追加。 -1.50 続く木浪が中前2点適時打を放ち、再びリードを広げた。 -0.55 終盤にも着実に加点し、前川がプロ初の猛打賞をマークした。 10.85 先発の西勇は5回7安打3失点で今季5勝目を挙げた。 1.55

Slide 36

Slide 36 text

阪神は打線が爆発し、2桁11得点の猛攻で連 敗を「5」でストップさせた。0・5ゲーム差で首位 だったDeNAが敗れたため、1試合で首位に返 り咲いた。なおも2死一塁で、大山が左越え9号 2ランをマーク。 T5への入力 36 入 力 T5

Slide 37

Slide 37 text

評価実験 37 評価基準 • 事実性:事実と異なっていないか • パーソナライズ性:指定した選手名を含んでいるか • 主題表現性:記事全体の要約を含んでいるか • 文法正確性:日本語として自然か • 情報妥当性:見出しで扱う情報として妥当か 評価者 • プロ野球ファン3名 データ • 訓練・検証 • 2021年の阪神タイガースに関する記事: 2,738件・152件 • 評価 • 2022年の阪神タイガースの試合結果を報じている記事:50件 使用モデル • sonoisa/t5-base-japanese

Slide 38

Slide 38 text

T5学習条件 38 学習率 • 3.0 × 10−4 バッチサイズ • 4 最適化アルゴリズム • Adam Weight Decay エポック数 • Patienceを10とした早期終了により決定

Slide 39

Slide 39 text

比較手法(全文入力) 39 記事全文 + 注目する選手名 入力 特定選手に 注目した 見出し T5 見出しの最初の単語を 指定した選手名にする 制 約 出力

Slide 40

Slide 40 text

評価方法 40 事実性 パーソナライズ性 主題表現性 文法正確性 情報妥当性 2値評価 5段階評価 3名の多数決により集計 3名の平均得点により集計

Slide 41

Slide 41 text

評価結果 41 手法 事実性 パーソナラ イズ性 主題表現性 文法正確性 情報妥当性 提案手法 (重要文入力) 0.56* 0.90 0.64 3.59 2.99 比較手法 (全文入力) 0.25 0.99* 0.60 3.39 2.70 事実性が向上!!

Slide 42

Slide 42 text

余計な情報の排除による精度の向上 42 本文で伝えていること • 阪神が中日相手に逆転勝ちしたこと。 • ガンケル投手が8回1失点の好投をしたこと。 • 佐藤選手が猛打賞の活躍をしたこと。 提案手法(重要文入力) • 阪神が逆転勝ちガンケルは昨季3戦3勝の 中日相手に8回1失点 比較手法(全文入力) • ガンケル、今季6度目の猛打賞佐藤輝が 2点タイムリー&右翼線二塁打

Slide 43

Slide 43 text

余計な情報の排除による精度の向上 43 本文で伝えていること • 阪神が中日相手に逆転勝ちしたこと。 • ガンケル投手が8回1失点の好投をしたこと。 • 佐藤選手が猛打賞の活躍をしたこと。 提案手法(重要文入力) • 阪神が逆転勝ちガンケルは昨季3戦3勝の 中日相手に8回1失点 比較手法(全文入力) • ガンケル、今季6度目の猛打賞佐藤輝が 2点タイムリー&右翼線二塁打

Slide 44

Slide 44 text

評価結果 44 手法 事実性 パーソナラ イズ性 主題表現性 文法正確性 情報妥当性 提案手法 (重要文入力) 0.56* 0.90 0.64 3.59 2.99 比較手法 (全文入力) 0.25 0.99* 0.60 3.39 2.70 パーソナライズ性 は低下

Slide 45

Slide 45 text

提案手法:生成失敗の可能性有り 45 T5 出力 注目した選手名を 含まない見出し 注目した選手名を 含まない見出し 100個 注目した選手名を 含まない見出し 注目した選手名を 含まない見出し

Slide 46

Slide 46 text

比較手法:生成失敗の可能性無し 46 記事全文 + 注目する選手名 入力 特定選手に 注目した 見出し T5 見出しの最初の単語を 指定した選手名にする 制 約 出力

Slide 47

Slide 47 text

情報の繋げ方に関する課題 47 本文で伝えていること • 阪神が痛恨の敗戦をしたこと。 • 佐藤選手の左前適時打でリードを 2点に広げたこと。 提案手法(重要文入力) • 阪神痛恨敗戦佐藤輝の左前適時打 でリードを広げる

Slide 48

Slide 48 text

情報の繋げ方に関する課題 48 本文で伝えていること • 阪神が痛恨の敗戦をしたこと。 • 佐藤選手の左前適時打でリードを2 点に広げたこと。 提案手法(重要文入力) • 阪神痛恨敗戦佐藤輝の左前適時打 でリードを広げる 理想の見出し 佐藤輝が左前適時打の活躍も阪神痛恨敗戦

Slide 49

Slide 49 text

チームの情報を利用してしまう課題 49 本文で伝えていること • 阪神が連敗を止めて3位死守したこと。 • チームの完封勝利が今季20回目で52年ぶり であること。 • 西純矢投手が5勝目を挙げて今季5度目の連 敗ストッパーになったこと。 提案手法(重要文入力) • 阪神が連敗止めた西純の5勝目は52年ぶり 3位死守

Slide 50

Slide 50 text

チームの情報を利用してしまう課題 50 本文で伝えていること • 阪神が連敗を止めて3位死守したこと。 • チームの完封勝利が今季20回目で52年ぶり であること。 • 西純矢投手が5勝目を挙げて今季5度目の連 敗ストッパーになったこと。 提案手法(重要文入力) • 阪神が連敗止めた西純の5勝目は52年ぶり 3位死守

Slide 51

Slide 51 text

まとめと今後の課題 51 まとめ • 特定選手に注目した見出しの生成 • 工夫点 : 抽出した重要文を入力 • 評価結果 : 事実性向上 今後の課題 • ポジティブ情報とネガティブ情報の繋げ方 • チーム情報との区別 • 別ジャンルの記事への応用