Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理研究室 B4 Seminar
Search
takegue
February 19, 2014
Technology
0
210
自然言語処理研究室 B4 Seminar
論文紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
takegue
February 19, 2014
Tweet
Share
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
870
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.4k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1.1k
Rettyにおけるデータ活用について
takegue
0
900
Sparse Overcomplete Word Vector Representations
takegue
0
220
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
210
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
120
Dependency-based empty category detection via phrase structure trees
takegue
0
79
Other Decks in Technology
See All in Technology
AIエージェントの開発に必須な「コンテキスト・エンジニアリング」とは何か──プロンプト・エンジニアリングとの違いを手がかりに考える
masayamoriofficial
0
370
実践アプリケーション設計 ③ドメイン駆動設計
recruitengineers
PRO
1
160
会社にデータエンジニアがいることでできるようになること
10xinc
9
1.6k
AIとTDDによるNext.js「隙間ツール」開発の実践
makotot
5
660
RAID6 を楔形文字で組んで現代人を怖がらせましょう(実装編)
mimifuwa
0
300
歴代のWeb Speed Hackathonの出題から考えるデグレしないパフォーマンス改善
shuta13
6
600
株式会社ARAV 採用案内
maqui
0
340
TypeScript入門
recruitengineers
PRO
8
1.6k
帳票Vibe Coding
terurou
0
140
広島銀行におけるAWS活用の取り組みについて
masakimori
0
130
DeNA での思い出 / Memories at DeNA
orgachem
PRO
3
1.6k
Postman MCP 関連機能アップデート / Postman MCP feature updates
yokawasa
0
150
Featured
See All Featured
Code Reviewing Like a Champion
maltzj
525
40k
BBQ
matthewcrist
89
9.8k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
The Invisible Side of Design
smashingmag
301
51k
Facilitating Awesome Meetings
lara
55
6.5k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.6k
We Have a Design System, Now What?
morganepeng
53
7.7k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
The Cult of Friendly URLs
andyhume
79
6.5k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
The Cost Of JavaScript in 2023
addyosmani
53
8.8k
Transcript
自然言語処理研究室 B4 ゼミ 2014年度 第1週 論文紹介 名詞句の語彙統語パターンを用いた 事態性名詞の項構造解析 長岡技術科学大学 B4
竹野 峻輔
• 小町守, 飯田龍, 乾健太郎 & 松本裕治. 名詞句の 語彙統語パターンを用いた事態性名詞の項構造解 析. 自然言語処理
= J. Nat. Lang. Process. 17, 141–159 (2010). • 概要: –述語項構造解析を 事態性名詞の項構造解析へ適用 –語彙統語パターンを判別に利用 (≒複合語の生成パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 文献紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析 2
• 述語項構造解析 – 文中の「誰が」「何を」「どうした」 ⇒ 項 – 述語:「どうした」(形容詞や動詞)を中心に項を解析 • 事態性名詞
– 事態性:行為や状態,出来事 を表す. • 「上司ガ彼ヲ推薦(する)」 ⇒ 述語項構造と一致 – 文脈から事態性の有無が変化する. e.g) 「電話」 … (公式)電話[物体], 電話(する)(事態) – NAISTテキストコーパスは事態21.1%が事態性名詞 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. はじめに:述語項構造解析と事態性 3
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 4 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 5 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues ・特徴的な統語素性が使える ・語義曖昧解消の解決手法が使える
• 事態性判別のための語彙統語パターンを教師なし学習 – BACT*1による木構造のパターンマイニング 正例パターン)同一文節中にサ変名詞+サ変名詞がある 負例パターン)後ろにサ変名詞がある • 事態性判別の分類精度の向上を確認 – 分類器はSVM
(TinySVM)利用 – 最頻出語義,語彙統語パターンなし・有りを比較 • 素性:文節内素性,文節外素性(+語彙統合パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性の判別 6 *1 http://chasen.org/~taku/software/bact/
• 事態性が無いと判定された誤り例 – … 妻の和江さんらが現地と電話のやり取りを続けた. – … 選挙だ」と述べ,選挙協力よりも独自候補擁立を 優先すべきだとの考えを示した. 課題:事態性判別と項同定を同時に最適化
1. ゼロ照応解析⇒項同定⇒事態判別(Iida et al.2006) 2. Markov Logic Networkによる同時判定(Meza-Ruiz and Riedel 2009) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性判別 - エラー分析 7 周辺文脈が事態性のない一般名詞と一致 “選挙二 協力(する)” といった項の関係が反映されていない
• 動詞と格要素の共起の利用 – サ変名詞 は 動詞 と共通の項を持つと仮定している. – 名詞nが格助詞cを介し,動詞vと係る共起確率を計算. •
pLSI手法を用いたスムージング. • Zは潜在的な意味クラス (|Z| = 1000) • 新聞19年度分・EMアルゴリズムより各確率を計算 – 共起尺度 PMIを利用⇒最尤候補との相対値を素性に利用 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 8
• 支援動詞辞書の作成および利用 – 事態性名詞の格助詞を伴わない 問題を解決 – “電話する” から事態性名詞”電話”の格を推定 – 格の交替も記述
• “彼女に勉強を教える” ⇒ “彼女ガ勉強(する)” • 項同定の判定:トーナメントモデルを利用したSVM – 局所的なものに対して適応できない “太郎が次郎の連勝を止める” ⇒ [連勝 ガ格:太郎] × [連勝 ガ格:太郎] × 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 9
• 語彙統語パターンを用いた事態性名詞の項構造解析 ⇒情報検索の下地 – 事態性判別 - 精度76.% 再現率79.6% – 項同定
– ガ格:68.3%, ヲ格:80.1%, ニ格:74.6% • 個人的感想 – 論文の構成 • 問題提起⇒手法提案⇒実験⇒議論⇒結論 – 素性の取り方:パターンマイニング – 述語項解析に関する知識 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 6. 結論 10