Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理研究室 B4 Seminar
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
takegue
February 19, 2014
Technology
210
0
Share
自然言語処理研究室 B4 Seminar
論文紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
takegue
February 19, 2014
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
900
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.5k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1.1k
Rettyにおけるデータ活用について
takegue
0
930
Sparse Overcomplete Word Vector Representations
takegue
0
260
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
240
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
140
Dependency-based empty category detection via phrase structure trees
takegue
0
100
Other Decks in Technology
See All in Technology
遊びで始めたNew Relic MCP、気づいたらChatOpsなオブザーバビリティボットができてました/From New Relic MCP to a ChatOps Observability Bot
aeonpeople
1
160
【AWS】CloudTrail LakeとCloudWatch Logs Insightsの使い分け方針
tsurunosd
0
130
パワポ作るマンをMCP Apps化してみた
iwamot
PRO
0
300
Datadog で実現するセキュリティ対策 ~オブザーバビリティとセキュリティを 一緒にやると何がいいのか~
a2ush
0
190
サイボウズ 開発本部採用ピッチ / Cybozu Engineer Recruit
cybozuinsideout
PRO
10
77k
Babylon.js Japan Activities (2026/4)
limes2018
0
170
互換性のある(らしい)DBへの移行など考えるにあたってたいへんざっくり
sejima
PRO
0
540
Zephyr(RTOS)でARMとRISC-Vのコア間通信をしてみた
iotengineer22
0
130
契約書からの情報抽出を行うLLMのスループットを、バッチ処理を用いて最大40%改善した話
sansantech
PRO
3
350
最大のアウトプット術は問題を作ること
ryoaccount
0
290
FlutterでPiP再生を実装した話
s9a17
0
250
40代からのアウトプット ― 経験は価値ある学びに変わる / 20260404 Naoki Takahashi
shift_evolve
PRO
5
820
Featured
See All Featured
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.2k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
220
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
880
How STYLIGHT went responsive
nonsquared
100
6k
Utilizing Notion as your number one productivity tool
mfonobong
4
280
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
210
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Exploring anti-patterns in Rails
aemeredith
3
300
Producing Creativity
orderedlist
PRO
348
40k
Balancing Empowerment & Direction
lara
5
1k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
64
53k
Transcript
自然言語処理研究室 B4 ゼミ 2014年度 第1週 論文紹介 名詞句の語彙統語パターンを用いた 事態性名詞の項構造解析 長岡技術科学大学 B4
竹野 峻輔
• 小町守, 飯田龍, 乾健太郎 & 松本裕治. 名詞句の 語彙統語パターンを用いた事態性名詞の項構造解 析. 自然言語処理
= J. Nat. Lang. Process. 17, 141–159 (2010). • 概要: –述語項構造解析を 事態性名詞の項構造解析へ適用 –語彙統語パターンを判別に利用 (≒複合語の生成パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 文献紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析 2
• 述語項構造解析 – 文中の「誰が」「何を」「どうした」 ⇒ 項 – 述語:「どうした」(形容詞や動詞)を中心に項を解析 • 事態性名詞
– 事態性:行為や状態,出来事 を表す. • 「上司ガ彼ヲ推薦(する)」 ⇒ 述語項構造と一致 – 文脈から事態性の有無が変化する. e.g) 「電話」 … (公式)電話[物体], 電話(する)(事態) – NAISTテキストコーパスは事態21.1%が事態性名詞 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. はじめに:述語項構造解析と事態性 3
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 4 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues
• 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり
複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 5 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues ・特徴的な統語素性が使える ・語義曖昧解消の解決手法が使える
• 事態性判別のための語彙統語パターンを教師なし学習 – BACT*1による木構造のパターンマイニング 正例パターン)同一文節中にサ変名詞+サ変名詞がある 負例パターン)後ろにサ変名詞がある • 事態性判別の分類精度の向上を確認 – 分類器はSVM
(TinySVM)利用 – 最頻出語義,語彙統語パターンなし・有りを比較 • 素性:文節内素性,文節外素性(+語彙統合パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性の判別 6 *1 http://chasen.org/~taku/software/bact/
• 事態性が無いと判定された誤り例 – … 妻の和江さんらが現地と電話のやり取りを続けた. – … 選挙だ」と述べ,選挙協力よりも独自候補擁立を 優先すべきだとの考えを示した. 課題:事態性判別と項同定を同時に最適化
1. ゼロ照応解析⇒項同定⇒事態判別(Iida et al.2006) 2. Markov Logic Networkによる同時判定(Meza-Ruiz and Riedel 2009) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性判別 - エラー分析 7 周辺文脈が事態性のない一般名詞と一致 “選挙二 協力(する)” といった項の関係が反映されていない
• 動詞と格要素の共起の利用 – サ変名詞 は 動詞 と共通の項を持つと仮定している. – 名詞nが格助詞cを介し,動詞vと係る共起確率を計算. •
pLSI手法を用いたスムージング. • Zは潜在的な意味クラス (|Z| = 1000) • 新聞19年度分・EMアルゴリズムより各確率を計算 – 共起尺度 PMIを利用⇒最尤候補との相対値を素性に利用 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 8
• 支援動詞辞書の作成および利用 – 事態性名詞の格助詞を伴わない 問題を解決 – “電話する” から事態性名詞”電話”の格を推定 – 格の交替も記述
• “彼女に勉強を教える” ⇒ “彼女ガ勉強(する)” • 項同定の判定:トーナメントモデルを利用したSVM – 局所的なものに対して適応できない “太郎が次郎の連勝を止める” ⇒ [連勝 ガ格:太郎] × [連勝 ガ格:太郎] × 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 9
• 語彙統語パターンを用いた事態性名詞の項構造解析 ⇒情報検索の下地 – 事態性判別 - 精度76.% 再現率79.6% – 項同定
– ガ格:68.3%, ヲ格:80.1%, ニ格:74.6% • 個人的感想 – 論文の構成 • 問題提起⇒手法提案⇒実験⇒議論⇒結論 – 素性の取り方:パターンマイニング – 述語項解析に関する知識 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 6. 結論 10