Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150205 発表資料
Search
Yuta
February 05, 2015
Education
0
150
20150205 発表資料
Yuta
February 05, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
170
NLP2016 報告
sudo
0
190
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
260
20150909 発表資料
sudo
0
140
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
190
20150512 文献紹介
sudo
0
180
Other Decks in Education
See All in Education
人になにかを教えるときに考えていること(2025-05版 / VRC-LT #18)
sksat
5
1.2k
探査機自作ゼミ2025スライド
sksat
3
780
サンキッズゾーン 春日井駅前 ご案内
sanyohomes
0
930
2025年度春学期 統計学 第12回 分布の平均を推測する ー 区間推定 (2025. 6. 26)
akiraasano
PRO
0
160
新卒研修に仕掛ける 学びのサイクル / Implementing Learning Cycles in New Graduate Training
takashi_toyosaki
1
220
【Discordアカウント作成ガイド】
ainischool
0
110
Common STIs in London: Symptoms, Risks & Prevention
medicaldental
0
140
ROSConJP 2025 発表スライド
f0reacharr
0
210
『会社を知ってもらう』から『安心して活躍してもらう』までの プロセスとフロー
sasakendayo
0
260
バックオフィス組織にも「チームトポロジー」の考えが使えるかもしれない!!
masakiokuda
0
130
技術勉強会 〜 OAuth & OIDC 入門編 / 20250528 OAuth and OIDC
oidfj
5
1.8k
EVOLUCIÓN DE LAS NEUROCIENCIAS EN LOS CONTEXTOS ORGANIZACIONALES
jvpcubias
0
150
Featured
See All Featured
The Invisible Side of Design
smashingmag
301
51k
Gamification - CAS2011
davidbonilla
81
5.4k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
920
Faster Mobile Websites
deanohume
309
31k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
810
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
The Art of Programming - Codeland 2020
erikaheidi
56
13k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.9k
Agile that works and the tools we love
rasmusluckow
330
21k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
61k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.2k
Transcript
質問応答 自然言語処理研究室 B3 須戸悠太 1
質問応答とは • 質問に対して、知識を用いて解答を提示する。 • 例:「日本で一番高い山は?」 ▫ →「富士山」と返す。 2
出力結果の違い • 情報検索 ▫ 解答が含まれると考えられるテキスト • 質問応答 ▫ 解答そのもの 3
システム • 「質問の解析」 • 「テキスト検索」 • 「解答の抽出」 の3つのモジュールより構成される。 4
質問の解析 • 質問を解析し、以下の情報を抽出する。 ▫ ①. テキストの検索に必要なキーワード集合 (検索要求) ▫ ②. 期待されている解答の情報
例:「日本で一番高い山は?」 →①:「日本」「一番」「高い」「山」 →②:「山の名前」 5
テキスト検索 • テキスト検索システムを用いる。 • 「質問の解析」で抽出したキーワードを利用し て、大規模なテキスト集合から解答を含んでい ると考えられるテキストを検索する。 6
検索結果 7
解答の抽出 • 検索されたテキストに対して固有名抽出を行う。 ▫ →テキスト中に出現する固有名を同定 • 解答として期待されている固有名のタイプと合 致する、解答として適当な文字列を出力。 8
システム構造 9 テキスト検索 質問の解析 解答の抽出 テキスト集合 質問 解答 検索要求 解答のタイプ
該当テキスト
システム構造 • 質問応答のシステムはテキスト検索と情報抽出 (特に固有名抽出)を組み合わせて実現された 技術である。 10
欠点 • 解答が固有名である質問を想定 ▫ →解答が文章となるような質問への対応が課題 ▫ 例 ▫ 「iPS細胞とは何か?」 ▫
「なぜ雲はできるのか?」 11
Watson • IBMが開発した質問応答システム • アメリカのクイズ番組「Jeopardy!(ジョパ ディ!)」で解答者として挑戦し、人間の解答者 に勝利した。 12
何が凄い? • 「Jeopardy!」の問題文は質問ではなく、事実の 形で書かれており、その文章が何を意味してい るのか回答する形式である。 13
問題文の例 • 「米国が外交関係を持たない世界の4カ国のうち、 この国は最も北にある」 • 質問:「この国」 • 解答:「北朝鮮」 • 問題文の理解(何を聞いているのか)が必要と
なる。 14
勝つための課題 • 幅広い知識が問われる • 正解率 ▫ 不正解の場合、減点されるため。 • 戦略 ▫
掛金が倍になる問題が存在し、自分の得点に応じ て攻めるかの判断が必要。 15
参考資料 • 自然言語処理の基礎 ▫ 奥村学, コロナ社 • 【森山和道の「ヒトと機械の境界面」】 クイズ王を破ったIBMの質問応答システム 「Watson」とは
▫ http://pc.watch.impress.co.jp/docs/column/kyok ai/20110323_434297.html 16