Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
係り受け関係を利用した感情生起表現の抽出
Search
自然言語処理研究室
March 31, 2006
Research
0
120
係り受け関係を利用した感情生起表現の抽出
遠藤 大介、齋藤 真実、山本 和英. 係り受け関係を利用した感情生起表現の抽出. 言語処理学会第12回年次大会, pp.947-950 (2006.3)
自然言語処理研究室
March 31, 2006
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
480
データサイエンス12_分類.pdf
jnlp
0
340
データサイエンス11_前処理.pdf
jnlp
0
460
Recurrent neural network based language model
jnlp
0
130
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
96
自然言語処理研究室 研究概要(2014年)
jnlp
0
120
自然言語処理研究室 研究概要(2015年)
jnlp
0
190
Other Decks in Research
See All in Research
問いを起点に、社会と共鳴する知を育む場へ
matsumoto_r
PRO
0
540
一人称視点映像解析の最先端(MIRU2025 チュートリアル)
takumayagi
6
3.2k
診断前の病歴テキストを対象としたLLMによるエンティティリンキング精度検証
hagino3000
1
120
IMC の細かすぎる話 2025
smly
2
550
ストレス計測方法の確立に向けたマルチモーダルデータの活用
yurikomium
0
1.1k
GeoCLIP: Clip-Inspired Alignment between Locations and Images for Effective Worldwide Geo-localization
satai
3
290
RHO-1: Not All Tokens Are What You Need
sansan_randd
1
160
Agentic AIとMCPを利用したサービス作成入門
mickey_kubo
0
400
20250725-bet-ai-day
cipepser
2
370
SSII2025 [SS1] レンズレスカメラ
ssii
PRO
2
1k
多言語カスタマーインタビューの“壁”を越える~PMと生成AIの共創~ 株式会社ジグザグ 松野 亘
watarumatsuno
0
110
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
2
1.3k
Featured
See All Featured
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
GraphQLとの向き合い方2022年版
quramy
49
14k
Faster Mobile Websites
deanohume
309
31k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Why Our Code Smells
bkeepers
PRO
338
57k
Embracing the Ebb and Flow
colly
86
4.8k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.4k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Transcript
1 係り受け関係を利用した 感情生起表現の抽出 長岡技術科学大学 電気系 遠藤 大介 齋藤 真実 山本 和英 平成18年3月16日
2 感情生起表現 書き手の感情が生起した要因 ・「嬉しい」や「悲しい」のように書き 手の感情を直接表している表現とは異な る ・「上手くいかない」「自分だけ処分さ れる」のような 2 文節
3 目的 ▪フレーズ辞書の構築 ・利点 → パタン辞書とは違い、意味理解などの 高度な処理が不必要 → 特徴的な表現が抽出できる可能性があ る
4 処理の流れ 抽出した文の構文解析 感情表現の係り元 2 文節を抽出 抽出した 2 文節をフィルタリング コーパスから感情生起表現を
含む文の抽出 感情生起表現
5 種用感情表現辞書 ▪既存の感情表現事典から一部使用 感情分類 10 分類 ( 喜怒哀怖恥好厭昂安驚 )
登録語数 2167 語収録 ↓ 種用感情表現辞書に登録した表現数 → 333 語 ➔楽しい ( 喜 ) 、腹立たしい ( 怒 ) 等 種用感情表現辞書の条件 - 「形容詞」または「名詞 - 形容動 詞語幹」
6 提案手法 (1/3) ▪感情生起表現を含む文の抽出 2 つの条件を満たす文から感情生起表 現を抽出する。 ➔感情表現を含む文 ➔「のが」もしくは「ことが」を含む
文 例: ・この面白さを伝えようにもなかなか上手く いかない ( のが ) もどかしいところです。
7 提案手法 (2/3) ▪感情生起表現候補の抽出 南瓜を用いて構文解析を行う。 例 人前に 出る (
のが )恥ずかしい 典型的な 長男。 感情表現 : 恥ずかしい 感情生起表現 : 人前に出るのが
8 提案手法 (3/3) ▪品詞情報によるフィルタリング 「 人前に 出るのが 」 「連体詞」「名詞 -
非自立」「名詞 - 数」 「形容詞 - 自立」 「名詞 - サ変接続」 「名詞 - 形容動詞語幹」 「動詞」 例:「ことが」「大きな」等の表現 例:「安い」「会う」等の表現 × ◦
9 評価実験 (1/3) ▪使用したコーパス→ Web コーパス Web コーパスを利用する利点 ➔
大量のテキストを容易に収集でき る。 ➔新聞に含まれるテキストよりも掲示 板や Weblog など主観的な文章が存在 する。 ➔多くの人が書いているため、様々な 表現が抽出できる。
10 評価実験 (2/3) ▪感情生起表現の抽出数推移 2131 8043 10059/10174 Webコーパス1 Webコーパス2 異なり数/合計
抽出表現数[個] 抽出表現数 ・ Web コーパス 1 : 0.4GB 486 万文 ・ Web コーパス 2 : 1.0GB 898 万文 合計と異なり数の差が小さい → コーパス量の増加で表現数が増加する
11 評価実験 (3/3) A[%] B[%] C[%] D[%] 21 39 3
37 15 25 4 56 総合 16 28 4 52 Webコーパス1 Webコーパス2 コーパス別抽出精度 評価 A :「提示している感情を生起する」 評価 B :「人によっては提示している感情を生起する」 評価 D :「表現が感情を生起する要因とならない」 評価 C :「提示している感情以外の感情を生起する」 喜:自然とふれあうことが 哀:はかなくきえてしまうのが
12 提案手法についての検討 提案手法の利点 ➔コーパスから取り出す情報が係り受け関 係と品詞情報と末尾の字面である ➔種となった感情表現と同じ感情分類の感 情生起表現が抽出できる 提案手法の欠点
➔感情表現を含まない文からの抽出が出来 ない ➔3 文節を抽出しなければならない表現が 存在するため、拡張が必要
13 展望 ▪欠点 → 表現が大量に存在するため収集が困難 抽出表現数の増加 ➔コーパスの量を増やす ➔「のが」、「ことが」以外の表現へ の対応
精度向上 ➔抽出誤りに対する 3 文節目の補完
14 抽出例 (AB) ▪ A わいわいやるのが ( 喜 )
苗が大きくなっていくことが ( 喜 ) ズカズカ入り込んでこられるのが ( 怒 ) 残業代がつかないのが ( 哀 ) 展開が読めてしまうのが ( 厭 ) どうにも出来ないのが ( 昂 ) ▪ B 人と話すのが ( 喜 ) アクションが見れるのが ( 喜 ) 歳をとることが ( 哀 ) 答え合わせをするのが ( 怖 ) 絵を描くのが ( 好 ) 話題を共有することが ( 安 )
15 抽出例 (CD) ▪ C 信頼を得られていないのが ( 怒 )
情報を蓄積しておくことが ( 怖 ) ひとつだけ気に入らなかったのが ( 恥 ) ▪ D 世界に没頭するのが ( 喜 ) データとして利用されるのが ( 怒 ) 感じに老けちゃってるのが ( 哀 ) 量が減り続けているのが ( 怖 ) そのまま持っていくのが ( 恥 ) 特に寝るのが ( 好 ) 世の中になったのが ( 厭 ) アキラと遊ぶのが ( 安 ) 名前があったのが ( 驚 )