Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150205 発表資料
Search
Yuta
February 05, 2015
Education
0
150
20150205 発表資料
Yuta
February 05, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
170
NLP2016 報告
sudo
0
190
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
260
20150909 発表資料
sudo
0
140
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
190
20150512 文献紹介
sudo
0
180
Other Decks in Education
See All in Education
SARA Annual Report 2024-25
sara2023
1
180
2025.05.10 技術書とVoicyとわたし #RPALT
kaitou
1
230
ThingLink
matleenalaakso
28
4.1k
Are puppies a ranking factor?
jonoalderson
0
870
ARアプリを活用した防災まち歩きデータ作成ハンズオン
nro2daisuke
0
110
アウトプット0のエンジニアが半年でアウトプットしまくった話 With JAWS-UG
masakiokuda
2
320
予習動画
takenawa
0
7.2k
Dashboards - Lecture 11 - Information Visualisation (4019538FNR)
signer
PRO
1
2.1k
20250611_なんでもCopilot1年続いたぞ~
ponponmikankan
0
100
Open Source Summit Japan 2025のボランティアをしませんか
kujiraitakahiro
0
730
GitHubとAzureを使って開発者になろう
ymd65536
1
120
Tutorial: Foundations of Blind Source Separation and Its Advances in Spatial Self-Supervised Learning
yoshipon
1
120
Featured
See All Featured
Six Lessons from altMBA
skipperchong
28
3.9k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.4k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.4k
Unsuck your backbone
ammeep
671
58k
Code Review Best Practice
trishagee
69
19k
Navigating Team Friction
lara
187
15k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Optimising Largest Contentful Paint
csswizardry
37
3.3k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Balancing Empowerment & Direction
lara
1
430
Git: the NoSQL Database
bkeepers
PRO
430
65k
Transcript
質問応答 自然言語処理研究室 B3 須戸悠太 1
質問応答とは • 質問に対して、知識を用いて解答を提示する。 • 例:「日本で一番高い山は?」 ▫ →「富士山」と返す。 2
出力結果の違い • 情報検索 ▫ 解答が含まれると考えられるテキスト • 質問応答 ▫ 解答そのもの 3
システム • 「質問の解析」 • 「テキスト検索」 • 「解答の抽出」 の3つのモジュールより構成される。 4
質問の解析 • 質問を解析し、以下の情報を抽出する。 ▫ ①. テキストの検索に必要なキーワード集合 (検索要求) ▫ ②. 期待されている解答の情報
例:「日本で一番高い山は?」 →①:「日本」「一番」「高い」「山」 →②:「山の名前」 5
テキスト検索 • テキスト検索システムを用いる。 • 「質問の解析」で抽出したキーワードを利用し て、大規模なテキスト集合から解答を含んでい ると考えられるテキストを検索する。 6
検索結果 7
解答の抽出 • 検索されたテキストに対して固有名抽出を行う。 ▫ →テキスト中に出現する固有名を同定 • 解答として期待されている固有名のタイプと合 致する、解答として適当な文字列を出力。 8
システム構造 9 テキスト検索 質問の解析 解答の抽出 テキスト集合 質問 解答 検索要求 解答のタイプ
該当テキスト
システム構造 • 質問応答のシステムはテキスト検索と情報抽出 (特に固有名抽出)を組み合わせて実現された 技術である。 10
欠点 • 解答が固有名である質問を想定 ▫ →解答が文章となるような質問への対応が課題 ▫ 例 ▫ 「iPS細胞とは何か?」 ▫
「なぜ雲はできるのか?」 11
Watson • IBMが開発した質問応答システム • アメリカのクイズ番組「Jeopardy!(ジョパ ディ!)」で解答者として挑戦し、人間の解答者 に勝利した。 12
何が凄い? • 「Jeopardy!」の問題文は質問ではなく、事実の 形で書かれており、その文章が何を意味してい るのか回答する形式である。 13
問題文の例 • 「米国が外交関係を持たない世界の4カ国のうち、 この国は最も北にある」 • 質問:「この国」 • 解答:「北朝鮮」 • 問題文の理解(何を聞いているのか)が必要と
なる。 14
勝つための課題 • 幅広い知識が問われる • 正解率 ▫ 不正解の場合、減点されるため。 • 戦略 ▫
掛金が倍になる問題が存在し、自分の得点に応じ て攻めるかの判断が必要。 15
参考資料 • 自然言語処理の基礎 ▫ 奥村学, コロナ社 • 【森山和道の「ヒトと機械の境界面」】 クイズ王を破ったIBMの質問応答システム 「Watson」とは
▫ http://pc.watch.impress.co.jp/docs/column/kyok ai/20110323_434297.html 16