Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150205 発表資料
Search
Yuta
February 05, 2015
Education
0
160
20150205 発表資料
Yuta
February 05, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
Other Decks in Education
See All in Education
1202
cbtlibrary
0
210
2025-10-30 社会と情報2025 #05 CC+の代わり
mapconcierge4agu
0
110
子どもが自立した学習者となるデジタルの活用について
naokikato
PRO
0
190
IHLヘルスケアリーダーシップ研究会17期説明資料
ihlhealthcareleadership
0
900
Measuring your measuring
jonoalderson
1
360
CSS3 and Responsive Web Design - Lecture 5 - Web Technologies (1019888BNR)
signer
PRO
1
3.1k
Going over the Edge
jonoalderson
0
350
TinyGoをWebブラウザで動かすための方法+アルファ_20260201
masakiokuda
2
220
Cifrado asimétrico
irocho
0
380
心理学を学び活用することで偉大なスクラムマスターを目指す − 大学とコミュニティを組み合わせた学びの循環 / Becoming a great Scrum Master by learning and using psychology
psj59129
1
1.7k
学習指導要領と解説に基づく学習内容の構造化の試み / Course of study Commentary LOD JAET 2025
masao
0
120
TypeScript初心者向け完全ガイド
mickey_kubo
1
120
Featured
See All Featured
Paper Plane (Part 1)
katiecoart
PRO
0
4.3k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
0
260
Statistics for Hackers
jakevdp
799
230k
How to train your dragon (web standard)
notwaldorf
97
6.5k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
220
Being A Developer After 40
akosma
91
590k
Into the Great Unknown - MozCon
thekraken
40
2.3k
The agentic SEO stack - context over prompts
schlessera
0
640
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
220
Typedesign – Prime Four
hannesfritz
42
2.9k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
120
Transcript
質問応答 自然言語処理研究室 B3 須戸悠太 1
質問応答とは • 質問に対して、知識を用いて解答を提示する。 • 例:「日本で一番高い山は?」 ▫ →「富士山」と返す。 2
出力結果の違い • 情報検索 ▫ 解答が含まれると考えられるテキスト • 質問応答 ▫ 解答そのもの 3
システム • 「質問の解析」 • 「テキスト検索」 • 「解答の抽出」 の3つのモジュールより構成される。 4
質問の解析 • 質問を解析し、以下の情報を抽出する。 ▫ ①. テキストの検索に必要なキーワード集合 (検索要求) ▫ ②. 期待されている解答の情報
例:「日本で一番高い山は?」 →①:「日本」「一番」「高い」「山」 →②:「山の名前」 5
テキスト検索 • テキスト検索システムを用いる。 • 「質問の解析」で抽出したキーワードを利用し て、大規模なテキスト集合から解答を含んでい ると考えられるテキストを検索する。 6
検索結果 7
解答の抽出 • 検索されたテキストに対して固有名抽出を行う。 ▫ →テキスト中に出現する固有名を同定 • 解答として期待されている固有名のタイプと合 致する、解答として適当な文字列を出力。 8
システム構造 9 テキスト検索 質問の解析 解答の抽出 テキスト集合 質問 解答 検索要求 解答のタイプ
該当テキスト
システム構造 • 質問応答のシステムはテキスト検索と情報抽出 (特に固有名抽出)を組み合わせて実現された 技術である。 10
欠点 • 解答が固有名である質問を想定 ▫ →解答が文章となるような質問への対応が課題 ▫ 例 ▫ 「iPS細胞とは何か?」 ▫
「なぜ雲はできるのか?」 11
Watson • IBMが開発した質問応答システム • アメリカのクイズ番組「Jeopardy!(ジョパ ディ!)」で解答者として挑戦し、人間の解答者 に勝利した。 12
何が凄い? • 「Jeopardy!」の問題文は質問ではなく、事実の 形で書かれており、その文章が何を意味してい るのか回答する形式である。 13
問題文の例 • 「米国が外交関係を持たない世界の4カ国のうち、 この国は最も北にある」 • 質問:「この国」 • 解答:「北朝鮮」 • 問題文の理解(何を聞いているのか)が必要と
なる。 14
勝つための課題 • 幅広い知識が問われる • 正解率 ▫ 不正解の場合、減点されるため。 • 戦略 ▫
掛金が倍になる問題が存在し、自分の得点に応じ て攻めるかの判断が必要。 15
参考資料 • 自然言語処理の基礎 ▫ 奥村学, コロナ社 • 【森山和道の「ヒトと機械の境界面」】 クイズ王を破ったIBMの質問応答システム 「Watson」とは
▫ http://pc.watch.impress.co.jp/docs/column/kyok ai/20110323_434297.html 16