Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[論文紹介]User-Level Sentiment AnalysisIncorporati...
Search
ysekky
February 18, 2015
Research
370
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
[論文紹介]User-Level Sentiment Analysis Incorporating Social Network (KDD2011)
ysekky
February 18, 2015
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.4k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.9k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
830
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.3k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.5k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4.1k
Other Decks in Research
See All in Research
通時的な類似度行列に基づく単語の意味変化の分析
rudorudo11
0
310
Scalable dynamic origin-destination demand estimation enhanced by high-resolution satellite imagery data
satai
3
270
Harness Engineering and Al Agent
kzinmr
3
1.7k
Research Engineerという仕事 / Research Engineering: Bridging Research and Business
chck
1
210
NLP colloquium: AI Safety Survey
kanekomasahiro
0
660
コーディングエージェントとABNを再考
hf149
2
710
typst の使い方:言語学を研究する学生のために
gitomochang
0
460
羽田新ルート運用6年の検証
1manken
0
160
R&Dチームを起ち上げる
shibuiwilliam
1
270
AY 2026 Guide to Academic Writing Using Generative AI - Workshop
ks91
PRO
0
120
正規分布と最適化について
koide3
1
250
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
160
Featured
See All Featured
Paper Plane (Part 1)
katiecoart
PRO
0
9k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
160
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
180
XXLCSS - How to scale CSS and keep your sanity
sugarenia
250
1.3M
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Practical Orchestrator
shlominoach
191
11k
Claude Code のすすめ
schroneko
67
230k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
BBQ
matthewcrist
89
10k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Designing for Timeless Needs
cassininazir
1
250
Transcript
[論文紹介] User-‐Level Sen.ment Analysis Incorpora.ng Social Network
Chenhao Tan*1, Killian Lee*1, Jie Tang*2, Long Jiang*3, Ming Zhou*3, Ping Li*1 (Cornel University*1, Tsinghua University*2, MicrosoL Research Asia*3) KDD2011 Yoshifumi Seki (Gunosy Inc) 2015.02.17 @Gunosy研究会 #83
概要 • TwiZerを使ってユーザの感情分析をする – 半教師ありモデル • ネットワーク上のつながりのあるユーザの感 情は似るという仮説を調べる
– フォロー/フォロワー – メンション – 相互か否か?
Contribu.on • SNSで関係のあるユーザ同士が同じ意見を持 つことが多いことを • ネットワーク指標を加える事でテキストからだ けの予測よりも感情分析が改善することを示 した
• フォロー/フォロワーとメンションのネットワー クの比較や、パラメータ学習方法の比較も やった
Concrete Problem Se]ng • ユーザが該当するトピックに対してポジティブ かネガティブかを判定する • ユーザ同士がつながっているかを判定する
– フォローしているか – 相互フォローか – リプライしたか – 相互にリプライを送ったか
Data Collec.on • プロフィールに記載されている情報からトピッ クに対するポジネガを判定する – obama lover, an.-‐obamaとかプロフィールに書い てある
ある2人のユーザが同じ感情を持つ確率
意見の違いとユーザがConnectedである確率
Model Framework • クエリqに対するツイートとユーザのネットワー クを生成する • Eqはuser-‐tweetとuser-‐userのエッジの2種 – ユーザ間のエッジはmen.onとfollowの相互が一
方向かの4種
Proposed Model • Y: 感情ラベルベクトル – ユーザ数次元 • k,
l : 感情ラベル {0, 1} • μ, λ: それぞれをどの程度反映させるかの重 み付きパラメータ • f, h: feature func.on
User-‐tweet factor • 学習済の場合とそうでない場合で値を分ける • k: ユーザのラベル •
l: ツイートのラベル
User-‐User factor • k : ユーザiのラベル • l: ユーザjのラベル
• w_rela.on: 関係性に対する重み
重みの設定 • w_labeled = 1.0 • w_unlabeled = 0.125
• w_rela.on = 0/6 • labeleを1.0に固定し, w_unlabeledを[0.1-‐0.5], w_rela.on{0.5-‐0.8}で変化させて設定した
Parameter Es.ma.on and Predic.on • λ, μを推定する • No
Learning – 直接推定する • Learning – No Learningで得た初期値を元に学習する
Direct Es.ma.on from simple sta.s.cs • 学習はしない • つながっているユーザ間で一致している確率
を数えるだけ • ネガティブユーザはネガティブなポジティブ ユーザはポジティブなツイートしかしない
Simple Rank
• LLR(Ynew, Y) – Ynewの対数尤度-‐Yの対数尤度 • RealPref(Ynew, Y)
– Pref(Ynew) – Pref(Y) • Pref(Y) = Accuracy + MacroF1 • もっと良い学習方法はあるけど,本論文はモ デルの良さをいいたいだけだからあんまりそ こは問題にならない
Predic.on • Zの推定が難しい • 5回SimpleRankで推定してどっちのラベル だったかをvoteさせて決める
Experiment Produces • 10回実験する – 教師データとして50個ずつP/Nのユーザを選ぶ • ツイートのポジネガ分類
– トピックごとにラベル付きデータから分類器をつくる • Baseline(SVM) – SVMを使ってユーザのツイートで多い方の感情ラベルを 採用 • Heterogeneous Graph Model with Direct es.ma.on from simple sta.cs – 推定を学習しないでやったグラフモデル • Heterogeneous Graph Model with Simple Rank – Simple Rankで学習したグラフモデル
Case Study • Obamaに関するポジネ ガ • 緑:P, 赤N
• ラベル付きデータのグ ラフ • ベースラインと提案手 法を比較する
None
None
Performance Analysis 左がNoLearning, 右がLearning △は3トピック以上でベースラインを統計的に有意に上回る
Performance Analysis • 提案手法はベースラインよりよい • Followのほうがmen.onよりよい • directのほうがmutualよりよい
• LearningとNoLearningはそんなに変わらない
Per-‐topic performance: density vs. quality analysis
Adding more unlabeled data Learningがもっともよい結果