Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
係り受け関係を利用した感情生起表現の抽出
Search
自然言語処理研究室
March 31, 2006
Research
0
120
係り受け関係を利用した感情生起表現の抽出
遠藤 大介、齋藤 真実、山本 和英. 係り受け関係を利用した感情生起表現の抽出. 言語処理学会第12回年次大会, pp.947-950 (2006.3)
自然言語処理研究室
March 31, 2006
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
470
データサイエンス12_分類.pdf
jnlp
0
330
データサイエンス11_前処理.pdf
jnlp
0
450
Recurrent neural network based language model
jnlp
0
130
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
93
自然言語処理研究室 研究概要(2014年)
jnlp
0
110
自然言語処理研究室 研究概要(2015年)
jnlp
0
180
Other Decks in Research
See All in Research
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
180
数理最適化と機械学習の融合
mickey_kubo
15
8.8k
引力・斥力を制御可能なランダム部分集合の確率分布
wasyro
0
160
Agentic AIとMCPを利用したサービス作成入門
mickey_kubo
0
270
SatCLIP: Global, General-Purpose Location Embeddings with Satellite Imagery
satai
3
220
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
520
学生向けアンケート<データサイエンティストについて>
datascientistsociety
PRO
0
3.1k
大規模な2値整数計画問題に対する 効率的な重み付き局所探索法
mickey_kubo
1
260
チャッドローン:LLMによる画像認識を用いた自律型ドローンシステムの開発と実験 / ec75-morisaki
yumulab
1
450
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
2
1.2k
SkySense : A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery
satai
3
250
NLP2025SharedTask翻訳部門
moriokataku
0
300
Featured
See All Featured
Gamification - CAS2011
davidbonilla
81
5.3k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.7k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.4k
Facilitating Awesome Meetings
lara
54
6.4k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
Thoughts on Productivity
jonyablonski
69
4.7k
How to Ace a Technical Interview
jacobian
277
23k
KATA
mclloyd
30
14k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.3k
Transcript
1 係り受け関係を利用した 感情生起表現の抽出 長岡技術科学大学 電気系 遠藤 大介 齋藤 真実 山本 和英 平成18年3月16日
2 感情生起表現 書き手の感情が生起した要因 ・「嬉しい」や「悲しい」のように書き 手の感情を直接表している表現とは異な る ・「上手くいかない」「自分だけ処分さ れる」のような 2 文節
3 目的 ▪フレーズ辞書の構築 ・利点 → パタン辞書とは違い、意味理解などの 高度な処理が不必要 → 特徴的な表現が抽出できる可能性があ る
4 処理の流れ 抽出した文の構文解析 感情表現の係り元 2 文節を抽出 抽出した 2 文節をフィルタリング コーパスから感情生起表現を
含む文の抽出 感情生起表現
5 種用感情表現辞書 ▪既存の感情表現事典から一部使用 感情分類 10 分類 ( 喜怒哀怖恥好厭昂安驚 )
登録語数 2167 語収録 ↓ 種用感情表現辞書に登録した表現数 → 333 語 ➔楽しい ( 喜 ) 、腹立たしい ( 怒 ) 等 種用感情表現辞書の条件 - 「形容詞」または「名詞 - 形容動 詞語幹」
6 提案手法 (1/3) ▪感情生起表現を含む文の抽出 2 つの条件を満たす文から感情生起表 現を抽出する。 ➔感情表現を含む文 ➔「のが」もしくは「ことが」を含む
文 例: ・この面白さを伝えようにもなかなか上手く いかない ( のが ) もどかしいところです。
7 提案手法 (2/3) ▪感情生起表現候補の抽出 南瓜を用いて構文解析を行う。 例 人前に 出る (
のが )恥ずかしい 典型的な 長男。 感情表現 : 恥ずかしい 感情生起表現 : 人前に出るのが
8 提案手法 (3/3) ▪品詞情報によるフィルタリング 「 人前に 出るのが 」 「連体詞」「名詞 -
非自立」「名詞 - 数」 「形容詞 - 自立」 「名詞 - サ変接続」 「名詞 - 形容動詞語幹」 「動詞」 例:「ことが」「大きな」等の表現 例:「安い」「会う」等の表現 × ◦
9 評価実験 (1/3) ▪使用したコーパス→ Web コーパス Web コーパスを利用する利点 ➔
大量のテキストを容易に収集でき る。 ➔新聞に含まれるテキストよりも掲示 板や Weblog など主観的な文章が存在 する。 ➔多くの人が書いているため、様々な 表現が抽出できる。
10 評価実験 (2/3) ▪感情生起表現の抽出数推移 2131 8043 10059/10174 Webコーパス1 Webコーパス2 異なり数/合計
抽出表現数[個] 抽出表現数 ・ Web コーパス 1 : 0.4GB 486 万文 ・ Web コーパス 2 : 1.0GB 898 万文 合計と異なり数の差が小さい → コーパス量の増加で表現数が増加する
11 評価実験 (3/3) A[%] B[%] C[%] D[%] 21 39 3
37 15 25 4 56 総合 16 28 4 52 Webコーパス1 Webコーパス2 コーパス別抽出精度 評価 A :「提示している感情を生起する」 評価 B :「人によっては提示している感情を生起する」 評価 D :「表現が感情を生起する要因とならない」 評価 C :「提示している感情以外の感情を生起する」 喜:自然とふれあうことが 哀:はかなくきえてしまうのが
12 提案手法についての検討 提案手法の利点 ➔コーパスから取り出す情報が係り受け関 係と品詞情報と末尾の字面である ➔種となった感情表現と同じ感情分類の感 情生起表現が抽出できる 提案手法の欠点
➔感情表現を含まない文からの抽出が出来 ない ➔3 文節を抽出しなければならない表現が 存在するため、拡張が必要
13 展望 ▪欠点 → 表現が大量に存在するため収集が困難 抽出表現数の増加 ➔コーパスの量を増やす ➔「のが」、「ことが」以外の表現へ の対応
精度向上 ➔抽出誤りに対する 3 文節目の補完
14 抽出例 (AB) ▪ A わいわいやるのが ( 喜 )
苗が大きくなっていくことが ( 喜 ) ズカズカ入り込んでこられるのが ( 怒 ) 残業代がつかないのが ( 哀 ) 展開が読めてしまうのが ( 厭 ) どうにも出来ないのが ( 昂 ) ▪ B 人と話すのが ( 喜 ) アクションが見れるのが ( 喜 ) 歳をとることが ( 哀 ) 答え合わせをするのが ( 怖 ) 絵を描くのが ( 好 ) 話題を共有することが ( 安 )
15 抽出例 (CD) ▪ C 信頼を得られていないのが ( 怒 )
情報を蓄積しておくことが ( 怖 ) ひとつだけ気に入らなかったのが ( 恥 ) ▪ D 世界に没頭するのが ( 喜 ) データとして利用されるのが ( 怒 ) 感じに老けちゃってるのが ( 哀 ) 量が減り続けているのが ( 怖 ) そのまま持っていくのが ( 恥 ) 特に寝るのが ( 好 ) 世の中になったのが ( 厭 ) アキラと遊ぶのが ( 安 ) 名前があったのが ( 驚 )