Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Blogを対象とした商品価値の分析実験
Search
自然言語処理研究室
March 31, 2007
Research
0
77
Blogを対象とした商品価値の分析実験
青木 優, 山本 和英. Blogを対象とした商品価値の分析実験. 言語処理学会第13回年次大会, pp.680-683 (2007.3)
自然言語処理研究室
March 31, 2007
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
520
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
150
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
1.1k
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.5k
データサイエンティストの業務変化
datascientistsociety
PRO
0
300
2025-11-21-DA-10th-satellite
yegusa
0
130
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
610
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
200
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
240
教師あり学習と強化学習で作る 最強の数学特化LLM
analokmaus
2
970
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp
1
520
都市交通マスタープランとその後への期待@熊本商工会議所・熊本経済同友会
trafficbrain
0
170
LLMアプリケーションの透明性について
fufufukakaka
0
190
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
700
Featured
See All Featured
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
310
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
160
It's Worth the Effort
3n
188
29k
The SEO identity crisis: Don't let AI make you average
varn
0
420
Git: the NoSQL Database
bkeepers
PRO
432
66k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
120
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Design in an AI World
tapps
0
170
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Transcript
Blogを対象とした 商品価値の分析実験 長岡技術科学大学 電気系 青木優 山本和英
2 はじめに 背景 近年、Blogや電子掲示板など、書き手の主 観的な意見や評価が容易に入手可能 肯定的、否定的以外の分類指標について は言及されていない
商品の価値観に注目した分類指標 が必要なのでは?
3 価値分類とは? 肯定的意見 否定的意見 機能的価値 商品の機能や性能、もしくは使い方に関す
る説明が述べられている。 情緒的価値 商品に対する印象や思い入れが述べられ ている。
4 タスク設定 Blogを対象とする 文単位で分類 意見文判定 意見文orノイズの判定
価値分類 機能的or情緒的の判定 肯定的or否定的の判定 二値分類 問題 SVMで判定
5 SVMの素性(1/2) 1-gram 記号、未知語を除いた形態素 2-gram 記号を除いた形態素の連接
Stopword1 品詞が名詞、形容詞の形態素 Stopword2 品詞が名詞、形容詞、動詞、副詞の形態素 +助動詞「ない」
6 SVMの素性(2/2) Weight1 Stopword2の素性のみ重みを2倍 Weight2 Stopword2の素性を使用
素性の重みを以下の式より決定 scorew= Pw−N w PwN w P(w) : 正例で素性wが出現する頻度 N(w) : 負例で素性wが出現する頻度
7 評価実験 意見文判定、 価値分類の 精度をそ れ ぞれ独立に 評価
訓練用デー タ ドメインが混在 (パソコン、デジカメ、携帯 電話、MP3プレーヤー、プリンター、シャン プー、化粧品、ビール、お茶、ブランド) 評価用デー タ 単独ドメイン (菓子)
8 実験データ Blogを使用 (分析経験者が判定) 訓練用データ 評価用データ (8400/8400) (563/780) (3400/3400)
(254/207) (1500/1500) (314/86) 意見文 / ノイズ 16800文 1343文 機能 / 情緒 6800文 461文 肯定 / 否定 3000文 406文 データ提供 : 日経リサーチ
9 各分類器の精度 意見文判定 素性 [%] [%] [%] 1-gram 67.8 76.6
67.2 2-gram 67.6 75.6 64.4 Segment 62.2 59.4 59.4 Stopword1 68.0 69.2 67.9 Stopword2 69.0 73.6 67.5 Weight1 66.2 72.2 69.0 Weight2 69.2 76.6 68.1 従来手法 66.4 76.9 66.8 肯定 / 否定 機能 / 情緒
10 考察・検討(1/2) 情緒的価値の特徴 「楽しい」「面白い」「うれしい」など ドメインに依存しない表現が多い? → 特徴が捉えやす
い? しかし実際は… 複雑な表現も多数存在 特徴が掴みづ らい(特に印象など) 表層情報だけでは判定が困 難
11 考察・検討(2/2) 価値分類の定義 機能的価値 情緒的価値 一文中に混在 → 機能的価値 !
分類誤 りの原因 に… 機能 or NOT、情緒 or NOT で判定 定義の見直しが必要
12 今後の課題 肯定 否定 情緒 機能 商品A:50% 操作性: 60% 典型文:
・・・ 商品A:30% 喜び: 40% 典型文: ・・・ 商品A:10% 価格:20% 典型文: ・・・ 商品A:10% 怒り: 10% 典型文: ・・・
13 分類結果の例(1/2) 機能的価値&肯定的意見 『コクのあるミルクキャラメルのおいしさを、 そのままチョコレートで再現した親しみやす い味わいです。』 情緒的価値&否定的意見
『……なんか不味そうだ。』 情緒的価値(分類誤り) 『ズルズルっ 麺はなかなかシコシコとして おいしいかも。』
14 分類結果の例(2/2) 機能的価値(分類誤り) 『チョコレート効果は、以前にも書いたとおり 、結構はまっています。』 判定が困難
『久々のチョコレートは甘さが染み渡ります』 機能/情緒が混在 『印刷もキレイだし、見た目もなかなかスタイ リッシュなので気に入っています♪』
15 従来手法 藤村ら(2004) scorew= Pw−N w PwN wk P(w)
: 正例で素性wが出現する頻度 N(w) : 負例で素性wが出現する頻度 sentence scoreS =∑ w⊂S scorew
16 システム全体の評価 0 1 2 3 4 5 0 10
20 30 40 50 60 70 80 90 100 0 100 200 300 400 500 精度 ( 肯定否定 ) 抽出数 ( 肯定否定 ) 精度 ( 機能情緒 ) 抽出数 ( 機能情緒 ) 抽出数 閾値 抽出精度 [%]
Blogを対象とした 商品価値の分析実験 長岡技術科学大学 電気系 青木優 山本和英 日経リサーチ 大浜毅美 佐藤邦弘