Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
係り受け関係を利用した感情生起表現の抽出
Search
自然言語処理研究室
March 31, 2006
Research
0
110
係り受け関係を利用した感情生起表現の抽出
遠藤 大介、齋藤 真実、山本 和英. 係り受け関係を利用した感情生起表現の抽出. 言語処理学会第12回年次大会, pp.947-950 (2006.3)
自然言語処理研究室
March 31, 2006
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
330
データサイエンス13_解析.pdf
jnlp
0
380
データサイエンス12_分類.pdf
jnlp
0
290
データサイエンス11_前処理.pdf
jnlp
0
400
Recurrent neural network based language model
jnlp
0
100
自然言語処理研究室 研究概要(2012年)
jnlp
0
100
自然言語処理研究室 研究概要(2013年)
jnlp
0
70
自然言語処理研究室 研究概要(2014年)
jnlp
0
66
自然言語処理研究室 研究概要(2015年)
jnlp
0
120
Other Decks in Research
See All in Research
Evolutionary Optimization ofModel Merging Recipes (2024/04/17, NLPコロキウム)
iwiwi
9
3.1k
Prompt Tuning から Fine Tuning への移行時期推定
icoxfog417
17
7k
Webスケールデータセットに対する実用的なポイズニング手法 / Poisoning Web-Scale Training Datasets is Practical
nttcom
0
120
Generative AI - practice and theory
gpeyre
1
580
クリック率を最大化しない推薦システム
joisino
42
14k
F0に基づいて伸縮された画像文字からの音声合成 [ASJ2024春]
nehi0615
0
120
VAR モデルによる OSS プロジェクト同士が生存性に与える 影響の分析
noppoman
0
140
Combating Misinformation in the age of LLMs
teacherpeterpan
0
140
第14回対話システムシンポジウム EMNLP 2023 参加報告
atsumoto
0
160
DeepCrysTet: A Deep Learning Approach Using Tetrahedral Mesh for Predicting Properties of Crystalline Materials
tsurubee
0
380
センサデータを活用した 肌質改善への支援システムに関する研究
comfortdesignlab
0
160
デフスポーツにおける支援技術 〜競技特性・ルールと技術との関係〜
slab
0
220
Featured
See All Featured
BBQ
matthewcrist
80
8.8k
Reflections from 52 weeks, 52 projects
jeffersonlam
345
19k
The Cost Of JavaScript in 2023
addyosmani
19
3.9k
[RailsConf 2023] Rails as a piece of cake
palkan
27
4k
Building Applications with DynamoDB
mza
88
5.6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
11
1.5k
How to train your dragon (web standard)
notwaldorf
74
5.2k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
126
32k
Web development in the modern age
philhawksworth
203
10k
Robots, Beer and Maslow
schacon
PRO
155
7.9k
GraphQLの誤解/rethinking-graphql
sonatard
55
9.3k
Mobile First: as difficult as doing things right
swwweet
217
8.6k
Transcript
1 係り受け関係を利用した 感情生起表現の抽出 長岡技術科学大学 電気系 遠藤 大介 齋藤 真実 山本 和英 平成18年3月16日
2 感情生起表現 書き手の感情が生起した要因 ・「嬉しい」や「悲しい」のように書き 手の感情を直接表している表現とは異な る ・「上手くいかない」「自分だけ処分さ れる」のような 2 文節
3 目的 ▪フレーズ辞書の構築 ・利点 → パタン辞書とは違い、意味理解などの 高度な処理が不必要 → 特徴的な表現が抽出できる可能性があ る
4 処理の流れ 抽出した文の構文解析 感情表現の係り元 2 文節を抽出 抽出した 2 文節をフィルタリング コーパスから感情生起表現を
含む文の抽出 感情生起表現
5 種用感情表現辞書 ▪既存の感情表現事典から一部使用 感情分類 10 分類 ( 喜怒哀怖恥好厭昂安驚 )
登録語数 2167 語収録 ↓ 種用感情表現辞書に登録した表現数 → 333 語 ➔楽しい ( 喜 ) 、腹立たしい ( 怒 ) 等 種用感情表現辞書の条件 - 「形容詞」または「名詞 - 形容動 詞語幹」
6 提案手法 (1/3) ▪感情生起表現を含む文の抽出 2 つの条件を満たす文から感情生起表 現を抽出する。 ➔感情表現を含む文 ➔「のが」もしくは「ことが」を含む
文 例: ・この面白さを伝えようにもなかなか上手く いかない ( のが ) もどかしいところです。
7 提案手法 (2/3) ▪感情生起表現候補の抽出 南瓜を用いて構文解析を行う。 例 人前に 出る (
のが )恥ずかしい 典型的な 長男。 感情表現 : 恥ずかしい 感情生起表現 : 人前に出るのが
8 提案手法 (3/3) ▪品詞情報によるフィルタリング 「 人前に 出るのが 」 「連体詞」「名詞 -
非自立」「名詞 - 数」 「形容詞 - 自立」 「名詞 - サ変接続」 「名詞 - 形容動詞語幹」 「動詞」 例:「ことが」「大きな」等の表現 例:「安い」「会う」等の表現 × ◦
9 評価実験 (1/3) ▪使用したコーパス→ Web コーパス Web コーパスを利用する利点 ➔
大量のテキストを容易に収集でき る。 ➔新聞に含まれるテキストよりも掲示 板や Weblog など主観的な文章が存在 する。 ➔多くの人が書いているため、様々な 表現が抽出できる。
10 評価実験 (2/3) ▪感情生起表現の抽出数推移 2131 8043 10059/10174 Webコーパス1 Webコーパス2 異なり数/合計
抽出表現数[個] 抽出表現数 ・ Web コーパス 1 : 0.4GB 486 万文 ・ Web コーパス 2 : 1.0GB 898 万文 合計と異なり数の差が小さい → コーパス量の増加で表現数が増加する
11 評価実験 (3/3) A[%] B[%] C[%] D[%] 21 39 3
37 15 25 4 56 総合 16 28 4 52 Webコーパス1 Webコーパス2 コーパス別抽出精度 評価 A :「提示している感情を生起する」 評価 B :「人によっては提示している感情を生起する」 評価 D :「表現が感情を生起する要因とならない」 評価 C :「提示している感情以外の感情を生起する」 喜:自然とふれあうことが 哀:はかなくきえてしまうのが
12 提案手法についての検討 提案手法の利点 ➔コーパスから取り出す情報が係り受け関 係と品詞情報と末尾の字面である ➔種となった感情表現と同じ感情分類の感 情生起表現が抽出できる 提案手法の欠点
➔感情表現を含まない文からの抽出が出来 ない ➔3 文節を抽出しなければならない表現が 存在するため、拡張が必要
13 展望 ▪欠点 → 表現が大量に存在するため収集が困難 抽出表現数の増加 ➔コーパスの量を増やす ➔「のが」、「ことが」以外の表現へ の対応
精度向上 ➔抽出誤りに対する 3 文節目の補完
14 抽出例 (AB) ▪ A わいわいやるのが ( 喜 )
苗が大きくなっていくことが ( 喜 ) ズカズカ入り込んでこられるのが ( 怒 ) 残業代がつかないのが ( 哀 ) 展開が読めてしまうのが ( 厭 ) どうにも出来ないのが ( 昂 ) ▪ B 人と話すのが ( 喜 ) アクションが見れるのが ( 喜 ) 歳をとることが ( 哀 ) 答え合わせをするのが ( 怖 ) 絵を描くのが ( 好 ) 話題を共有することが ( 安 )
15 抽出例 (CD) ▪ C 信頼を得られていないのが ( 怒 )
情報を蓄積しておくことが ( 怖 ) ひとつだけ気に入らなかったのが ( 恥 ) ▪ D 世界に没頭するのが ( 喜 ) データとして利用されるのが ( 怒 ) 感じに老けちゃってるのが ( 哀 ) 量が減り続けているのが ( 怖 ) そのまま持っていくのが ( 恥 ) 特に寝るのが ( 好 ) 世の中になったのが ( 厭 ) アキラと遊ぶのが ( 安 ) 名前があったのが ( 驚 )