$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理研究室 B4 Seminar
Search
takegue
February 19, 2014
Technology
0
210
自然言語処理研究室 B4 Seminar
論文紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
takegue
February 19, 2014
Tweet
Share
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
880
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.5k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1.1k
Rettyにおけるデータ活用について
takegue
0
920
Sparse Overcomplete Word Vector Representations
takegue
0
240
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
230
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
130
Dependency-based empty category detection via phrase structure trees
takegue
0
90
Other Decks in Technology
See All in Technology
Amazon Connect アップデート! AIエージェントにMCPツールを設定してみた!
ysuzuki
0
140
"人"が頑張るAI駆動開発
yokomachi
1
620
AIエージェントを5分で一気におさらい!AIエージェント「構築」元年に備えよう
yakumo
1
100
特別捜査官等研修会
nomizone
0
580
Claude Codeを使った情報整理術
knishioka
11
8.1k
[Neurogica] 採用ポジション/ Recruitment Position
neurogica
1
130
Knowledge Work の AI Backend
kworkdev
PRO
0
280
Identity Management for Agentic AI 解説
fujie
0
480
New Relic 1 年生の振り返りと Cloud Cost Intelligence について #NRUG
play_inc
0
240
意外と知らない状態遷移テストの世界
nihonbuson
PRO
1
270
ペアーズにおけるAIエージェント 基盤とText to SQLツールの紹介
hisamouna
2
1.7k
日本の AI 開発と世界の潮流 / GenAI Development in Japan
hariby
1
490
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
135
9.7k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
410
Exploring anti-patterns in Rails
aemeredith
2
210
What the history of the web can teach us about the future of AI
inesmontani
PRO
0
380
[RailsConf 2023] Rails as a piece of cake
palkan
58
6.2k
Paper Plane (Part 1)
katiecoart
PRO
0
2.1k
Being A Developer After 40
akosma
91
590k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
45
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Amusing Abliteration
ianozsvald
0
71
Highjacked: Video Game Concept Design
rkendrick25
PRO
0
250
Transcript
自然言語処理研究室 B4 ゼミ 2014年度 第1週 論文紹介 名詞句の語彙統語パターンを用いた 事態性名詞の項構造解析 長岡技術科学大学 B4
竹野 峻輔
• 小町守, 飯田龍, 乾健太郎 & 松本裕治. 名詞句の 語彙統語パターンを用いた事態性名詞の項構造解 析. 自然言語処理
= J. Nat. Lang. Process. 17, 141–159 (2010). • 概要: –述語項構造解析を 事態性名詞の項構造解析へ適用 –語彙統語パターンを判別に利用 (≒複合語の生成パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 文献紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析 2
• 述語項構造解析 – 文中の「誰が」「何を」「どうした」 ⇒ 項 – 述語:「どうした」(形容詞や動詞)を中心に項を解析 • 事態性名詞
– 事態性:行為や状態,出来事 を表す. • 「上司ガ彼ヲ推薦(する)」 ⇒ 述語項構造と一致 – 文脈から事態性の有無が変化する. e.g) 「電話」 … (公式)電話[物体], 電話(する)(事態) – NAISTテキストコーパスは事態21.1%が事態性名詞 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. はじめに:述語項構造解析と事態性 3
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 4 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 5 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues ・特徴的な統語素性が使える ・語義曖昧解消の解決手法が使える
• 事態性判別のための語彙統語パターンを教師なし学習 – BACT*1による木構造のパターンマイニング 正例パターン)同一文節中にサ変名詞+サ変名詞がある 負例パターン)後ろにサ変名詞がある • 事態性判別の分類精度の向上を確認 – 分類器はSVM
(TinySVM)利用 – 最頻出語義,語彙統語パターンなし・有りを比較 • 素性:文節内素性,文節外素性(+語彙統合パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性の判別 6 *1 http://chasen.org/~taku/software/bact/
• 事態性が無いと判定された誤り例 – … 妻の和江さんらが現地と電話のやり取りを続けた. – … 選挙だ」と述べ,選挙協力よりも独自候補擁立を 優先すべきだとの考えを示した. 課題:事態性判別と項同定を同時に最適化
1. ゼロ照応解析⇒項同定⇒事態判別(Iida et al.2006) 2. Markov Logic Networkによる同時判定(Meza-Ruiz and Riedel 2009) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性判別 - エラー分析 7 周辺文脈が事態性のない一般名詞と一致 “選挙二 協力(する)” といった項の関係が反映されていない
• 動詞と格要素の共起の利用 – サ変名詞 は 動詞 と共通の項を持つと仮定している. – 名詞nが格助詞cを介し,動詞vと係る共起確率を計算. •
pLSI手法を用いたスムージング. • Zは潜在的な意味クラス (|Z| = 1000) • 新聞19年度分・EMアルゴリズムより各確率を計算 – 共起尺度 PMIを利用⇒最尤候補との相対値を素性に利用 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 8
• 支援動詞辞書の作成および利用 – 事態性名詞の格助詞を伴わない 問題を解決 – “電話する” から事態性名詞”電話”の格を推定 – 格の交替も記述
• “彼女に勉強を教える” ⇒ “彼女ガ勉強(する)” • 項同定の判定:トーナメントモデルを利用したSVM – 局所的なものに対して適応できない “太郎が次郎の連勝を止める” ⇒ [連勝 ガ格:太郎] × [連勝 ガ格:太郎] × 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 9
• 語彙統語パターンを用いた事態性名詞の項構造解析 ⇒情報検索の下地 – 事態性判別 - 精度76.% 再現率79.6% – 項同定
– ガ格:68.3%, ヲ格:80.1%, ニ格:74.6% • 個人的感想 – 論文の構成 • 問題提起⇒手法提案⇒実験⇒議論⇒結論 – 素性の取り方:パターンマイニング – 述語項解析に関する知識 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 6. 結論 10