Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity ana...
Search
ysekky
June 01, 2015
Research
1
3.2k
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity analysis in smartphone news app
人工知能学会全国大会 研究報告
ysekky
June 01, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.2k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.7k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.1k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
780
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.9k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.5k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.2k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.4k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4k
Other Decks in Research
See All in Research
Adaptive Experimental Design for Efficient Average Treatment Effect Estimation and Treatment Choice
masakat0
0
120
[CV勉強会@関東 CVPR2025] VLM自動運転model S4-Driver
shinkyoto
2
510
Language Models Are Implicitly Continuous
eumesy
PRO
0
290
診断前の病歴テキストを対象としたLLMによるエンティティリンキング精度検証
hagino3000
1
150
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images
satai
3
300
Remote sensing × Multi-modal meta survey
satai
4
460
大学見本市2025 JSTさきがけ事業セミナー「顔の見えないセンシング技術:多様なセンサにもとづく個人情報に配慮した人物状態推定」
miso2024
0
160
IMC の細かすぎる話 2025
smly
2
670
snlp2025_prevent_llm_spikes
takase
0
350
国際論文を出そう!ICRA / IROS / RA-L への論文投稿の心構えとノウハウ / RSJ2025 Luncheon Seminar
koide3
9
5.3k
多言語カスタマーインタビューの“壁”を越える~PMと生成AIの共創~ 株式会社ジグザグ 松野 亘
watarumatsuno
0
130
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
1.1k
Featured
See All Featured
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Balancing Empowerment & Direction
lara
4
680
Music & Morning Musume
bryan
46
6.8k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.5k
Embracing the Ebb and Flow
colly
88
4.8k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
358
30k
Agile that works and the tools we love
rasmusluckow
331
21k
How to Ace a Technical Interview
jacobian
280
24k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
850
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
53k
Transcript
スマートフォンにおける コンテンツ閲覧と共有行動の分析 関 喜史*1*2, 松尾豊*2 株式会社Gunosy*1, 東京大学*2
2015/06/01 人工知能学会全国大会
目次 • 背景 • 概要 • 用いたデータについて
• 閲覧とシェアの概要について • トピックモデルを用いた分析 • ユーザとトピックに関する分析 • まとめ
背景 • バイラルメディアというSNSを主要な流入経路 としたメディアの急成長 – BuzzFeed 1.5億UU/month • 既存のメディアもバイラルメディア的戦略を取
り入れている – 東洋経済オンライン 1億PV/month • タイトルのリライトなどによりシェアを最大化する試み • コンテンツを共有させることに対する関心の 高まり
背景 • 既存の研究は共有された結果のみを扱っている – Tweet数からニュースの注目度を可視化・分析する [Jaewon Yang 2011]
– Tweetからユーザの興味を抽出する • [Fabian Abel 2011] • 共有行動の背景の閲覧は扱われていない – 共有はユーザが閲覧した上で共有するという意思決 定の上で起こる. – 共有の同期についてはアンケートを用いた研究は存 在するが実際の行動に基づいた研究は存在しない • [Chei Sian Lee 2012]
概要 • スマートフォンアプリケーションの行動ログか らユーザの閲覧情報と共有情報を分析する. • 共有の背景としての閲覧行動について分析 を行う – 閲覧と共有の関係性について
– 閲覧なしの共有について – 閲覧と共有が異なるユーザについて
用いたデータ[1/2] • スマートフォンアプリケーションGunosyにおけ る行動ログ – 内容 • コンテンツの閲覧
• コンテンツの共有 – データの範囲 • 2013年のある期間にシェアを活発に行なっていた 12,768人のユーザ • Gunosy上で配信されたコンテンツのタイトルと リード文
用いたデータ[2/2] • 行動データ – (記事識別子, ユーザ識別子, 行動種別, 行動時 間)
– 行動種別: 閲覧か共有化 • 記事データ – (記事識別子, 記事タイトル, リード文) – 記事タイトルやリード文は分析する際に用い,結 果として言及する際には概要のみを用いる
行動データの概要 • 86.2%が閲覧, 13.8%が共有 • 共有のうち30.6%は閲覧していないコンテンツ に対して行われている – ユーザ数としては9,055
人で今回の対象の70.9% にも登る
閲覧数上位の記事 記事の概要 1 企業経営者の不適切発言について 2 誤って子供がスマートフォンサイトで車を購入してしまった父親について 3 iOS7についての発表前の憶測記事 4 男性から印象の悪い女性の服装についてのランキング
5 話題になった新しいWebサービス・アプリの紹介 6 Facebookを楽しむコツは◦◦の写真をとること!食事でも風景でも家族でもなかっ た! 7 カバンが重い人は仕事ができないという記事 8 報・連・相についての記事 9 コンビニ経営がコンビニを閉店する理由について 10 アプリストアで無料になったアプリについてのまとめ記事
共有数上位の記事 1 地方にIT企業のサテライトオフィスができていることについて 2 報・連・相についての記事 3 居酒屋のスマホレジについて 4 日本企業におけるPDCAサイクルについて 5
iPhone, iPadアクセサリーについて 6 高校サッカー部のPVについて 7 アプリストアで無料になったアプリについてのまとめ記事 8 リーダーシップについて 9 ウェブデザインについて 10 アプリ開発サービスについて
閲覧なしで共有された数が上位の記事 1 iPhone, iPadアクセサリーについて 2 地方にIT企業のサテライトオフィスができていることについて 3 居酒屋のスマホレジについて 4 アプリストアで無料になったアプリについてのまとめ記事
5 iOSアプリのデザインについて 6 iPhoneの操作方法のTipsについて 7 有料iOSアプリの値段設定の仕様変更について 8 次世代iPhoneについての憶測記事 9 iOSアプリの課金についてのTips 10 音楽ストリーミングサービスについてのまとめ
行動データの概要 • 閲覧数が高い記事が共有数が高いわけでは ない • 共有数が高い記事が閲覧なしで共有されて いる数が多いわけではない
トピックによる分析 • LSIを用いてトピックを構成する – タイトルとリード文をMeCabにより形態素解析 – メディア名などを手動で取り除く – TF-‐IDFにより重み付けをしLSIで次元圧縮
– トピック数は300 • 最も大きなトピックに所属する記事数が全記事数の5% 以下になるように設定 13
トピックごとの閲覧数と共有数 • 正の相関がみられる • 閲覧数が高いからシェア数が高くなるというわけで はない • シェア率によってトピックごとの傾向を比較可能である
トピックごとの共有率 閲覧数が1万件を下回るトピックは計算から除いている
トピックごとの閲覧なしに共有された率 共有数が1,000件を下回るトピックは計算から除いている
トピックによる分析 • 共有率はトピックごとに異なりが見られ, 最大と 最小の比は2倍にもなる. – 共有されやすい・共有されにくいという違い •
共有されにくい: 恋愛, 炎上ネタ • 共有されやすい: 自然科学, 音楽, 健康 • 閲覧なし共有数はトピックごとで最大と最小で2.5 倍にもなる – 高いトピックは定常的にはシェア数が多くないが,一 部のコンテンツにより引き上げられている – 普段そのトピックを読まないユーザが引き上げている
ユーザとトピックによる分析 • 閲覧したトピックと共有したトピックの異なり方を 分析する • 最も閲覧したトピックと共有したトピックが異なる ユーザは4,112 人で全体の32.2%に登る
• どの組み合わせが多いかを分析する • N(v, s) – 最も閲覧したトピックがv, 最もシェアしたトピックがsの ユーザ数
• いずれの組み合わせも類似していないトピックのように見え る. • シェア率の低いコンテンツが閲覧側, シェア率の高いコンテ ンツがシェア側にきている
まとめ • 閲覧と共有について実データを用いて関係性の分析 を行った • 閲覧と共有では傾向が異なることを明らかにし,トピッ クごとに特徴があることを示した –
明らかにトピックによって閲覧したことを周りに示したい場 合とそうでない場合が存在する • 閲覧せずに共有を行われることが非常に多く,共有さ れるコンテンツにおいては一定度合いで起こる – 共有されにくいコンテンツがそのようなトピックの要素を含 んでいた場合には通常よりもより共有されることに繋がる