Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理研究室 B4 Seminar
Search
takegue
February 19, 2014
Technology
0
200
自然言語処理研究室 B4 Seminar
論文紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
takegue
February 19, 2014
Tweet
Share
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
830
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.3k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1k
Rettyにおけるデータ活用について
takegue
0
870
Sparse Overcomplete Word Vector Representations
takegue
0
200
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
210
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
120
Dependency-based empty category detection via phrase structure trees
takegue
0
73
Other Decks in Technology
See All in Technology
生成AI×財務経理:PoCで挑むSlack AI Bot開発と現場巻き込みのリアル
pohdccoe
1
780
事業モメンタムを生み出すプロダクト開発
macchiitaka
0
100
あなたが人生で成功するための5つの普遍的法則 #jawsug #jawsdays2025 / 20250301 HEROZ
yoshidashingo
2
320
【内製開発Summit 2025】イオンスマートテクノロジーの内製化組織の作り方/In-house-development-summit-AST
aeonpeople
2
1k
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
19k
【詳説】コンテンツ配信 システムの複数機能 基盤への拡張
hatena
0
280
エンジニアリング価値を黒字化する バリューベース戦略を用いた 技術戦略策定の道のり
kzkmaeda
7
3.1k
Autonomous Database Serverless 技術詳細 / adb-s_technical_detail_jp
oracle4engineer
PRO
17
45k
What's new in Go 1.24?
ciarana
1
110
EMConf JP 2025 懇親会LT / EMConf JP 2025 social gathering
sugamasao
2
200
目標と時間軸 〜ベイビーステップでケイパビリティを高めよう〜
kakehashi
PRO
8
800
Oracle Database Technology Night #87-1 : Exadata Database Service on Exascale Infrastructure(ExaDB-XS)サービス詳細
oracle4engineer
PRO
1
200
Featured
See All Featured
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.5k
A Tale of Four Properties
chriscoyier
158
23k
Bash Introduction
62gerente
611
210k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
How to Ace a Technical Interview
jacobian
276
23k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
430
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
10
1.3k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.5k
Transcript
自然言語処理研究室 B4 ゼミ 2014年度 第1週 論文紹介 名詞句の語彙統語パターンを用いた 事態性名詞の項構造解析 長岡技術科学大学 B4
竹野 峻輔
• 小町守, 飯田龍, 乾健太郎 & 松本裕治. 名詞句の 語彙統語パターンを用いた事態性名詞の項構造解 析. 自然言語処理
= J. Nat. Lang. Process. 17, 141–159 (2010). • 概要: –述語項構造解析を 事態性名詞の項構造解析へ適用 –語彙統語パターンを判別に利用 (≒複合語の生成パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 文献紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析 2
• 述語項構造解析 – 文中の「誰が」「何を」「どうした」 ⇒ 項 – 述語:「どうした」(形容詞や動詞)を中心に項を解析 • 事態性名詞
– 事態性:行為や状態,出来事 を表す. • 「上司ガ彼ヲ推薦(する)」 ⇒ 述語項構造と一致 – 文脈から事態性の有無が変化する. e.g) 「電話」 … (公式)電話[物体], 電話(する)(事態) – NAISTテキストコーパスは事態21.1%が事態性名詞 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. はじめに:述語項構造解析と事態性 3
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 4 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 5 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues ・特徴的な統語素性が使える ・語義曖昧解消の解決手法が使える
• 事態性判別のための語彙統語パターンを教師なし学習 – BACT*1による木構造のパターンマイニング 正例パターン)同一文節中にサ変名詞+サ変名詞がある 負例パターン)後ろにサ変名詞がある • 事態性判別の分類精度の向上を確認 – 分類器はSVM
(TinySVM)利用 – 最頻出語義,語彙統語パターンなし・有りを比較 • 素性:文節内素性,文節外素性(+語彙統合パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性の判別 6 *1 http://chasen.org/~taku/software/bact/
• 事態性が無いと判定された誤り例 – … 妻の和江さんらが現地と電話のやり取りを続けた. – … 選挙だ」と述べ,選挙協力よりも独自候補擁立を 優先すべきだとの考えを示した. 課題:事態性判別と項同定を同時に最適化
1. ゼロ照応解析⇒項同定⇒事態判別(Iida et al.2006) 2. Markov Logic Networkによる同時判定(Meza-Ruiz and Riedel 2009) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性判別 - エラー分析 7 周辺文脈が事態性のない一般名詞と一致 “選挙二 協力(する)” といった項の関係が反映されていない
• 動詞と格要素の共起の利用 – サ変名詞 は 動詞 と共通の項を持つと仮定している. – 名詞nが格助詞cを介し,動詞vと係る共起確率を計算. •
pLSI手法を用いたスムージング. • Zは潜在的な意味クラス (|Z| = 1000) • 新聞19年度分・EMアルゴリズムより各確率を計算 – 共起尺度 PMIを利用⇒最尤候補との相対値を素性に利用 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 8
• 支援動詞辞書の作成および利用 – 事態性名詞の格助詞を伴わない 問題を解決 – “電話する” から事態性名詞”電話”の格を推定 – 格の交替も記述
• “彼女に勉強を教える” ⇒ “彼女ガ勉強(する)” • 項同定の判定:トーナメントモデルを利用したSVM – 局所的なものに対して適応できない “太郎が次郎の連勝を止める” ⇒ [連勝 ガ格:太郎] × [連勝 ガ格:太郎] × 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 9
• 語彙統語パターンを用いた事態性名詞の項構造解析 ⇒情報検索の下地 – 事態性判別 - 精度76.% 再現率79.6% – 項同定
– ガ格:68.3%, ヲ格:80.1%, ニ格:74.6% • 個人的感想 – 論文の構成 • 問題提起⇒手法提案⇒実験⇒議論⇒結論 – 素性の取り方:パターンマイニング – 述語項解析に関する知識 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 6. 結論 10