Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150216 発表資料
Search
Yuta
February 16, 2015
Education
0
150
20150216 発表資料
Yuta
February 16, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
170
NLP2016 報告
sudo
0
190
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
260
20150909 発表資料
sudo
0
140
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
190
20150512 文献紹介
sudo
0
180
Other Decks in Education
See All in Education
今も熱いもの!魂を揺さぶる戦士の儀式:マオリ族のハカ
shubox
0
210
Education-JAWS #3 ~教育現場に、AWSのチカラを~
masakiokuda
0
170
Pythonパッケージ管理 [uv] 完全入門
mickey_kubo
20
15k
OpenRobomaster 中国のロボットコンテスト 日本連携の可能性
takasumasakazu
0
450
モンテカルロ法(3) 発展的アルゴリズム / Simulation 04
kaityo256
PRO
7
1.3k
Course Review - Lecture 12 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.7k
仮説の取扱説明書/User_Guide_to_a_Hypothesis
florets1
4
320
(キラキラ)人事教育担当のつらみ~教育担当として知っておくポイント~
masakiokuda
0
110
社外コミュニティと「学び」を考える
alchemy1115
2
170
Human-AI Interaction - Lecture 11 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
460
子どものためのプログラミング道場『CoderDojo』〜法人提携例〜 / Partnership with CoderDojo Japan
coderdojojapan
4
16k
AIの時代こそ、考える知的学習術
yum3
2
170
Featured
See All Featured
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.3k
Side Projects
sachag
455
42k
The World Runs on Bad Software
bkeepers
PRO
69
11k
How to train your dragon (web standard)
notwaldorf
95
6.1k
Designing for humans not robots
tammielis
253
25k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.9k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Mobile First: as difficult as doing things right
swwweet
223
9.7k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
138
34k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.8k
Being A Developer After 40
akosma
90
590k
The Invisible Side of Design
smashingmag
301
51k
Transcript
情報抽出 自然言語処理研究室 B3 須戸悠太 1
情報抽出とは • あらかじめ指定されたテンプレートを埋める形 で、テキストから指定された情報を抽出する。 • 「あるテキスト」 ▫ →「出来事」「日付」「場所」などを抽出 2
例:自然災害 • テキスト ▫ フィリピン政府によると、台風6号の影響で2008 年6月21日、同国中部と南部の各地で河川の氾濫 や地滑りが発生、少なくとも17人が死亡、数人が 行方不明となった。数万人が一時、避難した。 3
例:自然災害 • テンプレート 4 スロット 情報 出来事 台風6号 日付 2008年6月21日
場所 フィリピン中部と南部の各地 損害 河川の氾濫、地滑り 死者数 少なくとも17人 行方不明者数 数人
テンプレートから • 対象とするテキストのトピックにおいて重要か つ不可欠な内容であるということを表現。 • テキストの内容によってテンプレートのスロッ トは変化。 ▫ 例:「企業の新製品情報」 ▫
→「企業名」「商品名」「価格」「スペック」 「発売日」など 5
要素技術の分割 • 1. 固有名抽出 • 2. 属性抽出 • 3. 関係抽出
• 4. シナリオの認識 6
処理の流れ 7 テ キ ス ト 形 態 素 解
析 固 有 名 抽 出 構 文 解 析 属 性 ・ 関 係 抽 出 シ ナ リ オ の 認 識 照 応 解 析 推 論 抽 出 さ れ た テ ン プ レ ー ト
各種解析法では • 形態素解析 ▫ 単語への分割、品詞の付与 • 構文解析 ▫ 名詞句、動詞句などの句の抽出 •
照応解析 ▫ 代名詞の対象や省略要素の同定 8
固有名抽出 種類 例 人名 イチロー、徳川家康、… 地名 渋谷、大阪府、… 組織名 東京工業大学、東芝、… 人工物名
iPhone、PSP、… 時間表現 午前9時、正午、… 単位表現 kg、cm、… 9
固有名抽出の手法 • 知識ベースの手法 ▫ パターンを人手で記述 ▫ 構築のコストの大きさが問題 • 統計的な手法 ▫
訓練データを、機械学習アルゴリズムに与えるこ とで、抽出規則を自動的に学習する。 10
属性・関係抽出 • 属性抽出:固有名のもつ属性を抽出 ▫ 例:人名→性別、年齢など • 関係抽出:固有名間の関係の同定 ▫ 例:人名と組織名→従業員 11
シナリオの認識 • テキスト中に記述されたイベントをパターンに より抽出。 • パターンはあらかじめ用意しておき、テキスト と照合することで該当箇所を抽出。 12
余談 • Webページを対象とした情報抽出器 ▫ →ラッパと呼び、ビジネスなどに用いられる。 • 応用例 ▫ Twitterへの投稿から抽出 ▫
→ある商品に対する消費者の反応など 13