Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity ana...
Search
ysekky
June 01, 2015
Research
3.2k
1
Share
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity analysis in smartphone news app
人工知能学会全国大会 研究報告
ysekky
June 01, 2015
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.4k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.8k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
810
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.2k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.4k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4.1k
Other Decks in Research
See All in Research
Thirty Years of Progress in Speech Synthesis: A Personal Perspective on the Past, Present, and Future
ktokuda
0
200
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
320
YOLO26_ Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection
satai
3
310
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
470
AI Agentの精度改善に見るML開発との共通点 / commonalities in accuracy improvements in agentic era
shimacos
6
1.5k
LOSの検討(λ Kansai 2026 in Winter)
motopu
0
110
ScoreMatchingRiesz for Automatic Debiased Machine Learning and Policy Path Estimation with an Application to Japanese Monetary Policy Evaluation
masakat0
0
230
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
720
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
240
老舗ものづくり企業でリサーチが変革を起こすまで - 三菱重工DXの実践
skydats
0
110
存立危機事態の再検討
jimboken
0
260
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
160
Featured
See All Featured
Being A Developer After 40
akosma
91
590k
SEO for Brand Visibility & Recognition
aleyda
0
4.4k
How to build a perfect <img>
jonoalderson
1
5.4k
Mind Mapping
helmedeiros
PRO
1
150
HDC tutorial
michielstock
1
610
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
170
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
130
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
220
How to train your dragon (web standard)
notwaldorf
97
6.6k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
510
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
The agentic SEO stack - context over prompts
schlessera
0
740
Transcript
スマートフォンにおける コンテンツ閲覧と共有行動の分析 関 喜史*1*2, 松尾豊*2 株式会社Gunosy*1, 東京大学*2
2015/06/01 人工知能学会全国大会
目次 • 背景 • 概要 • 用いたデータについて
• 閲覧とシェアの概要について • トピックモデルを用いた分析 • ユーザとトピックに関する分析 • まとめ
背景 • バイラルメディアというSNSを主要な流入経路 としたメディアの急成長 – BuzzFeed 1.5億UU/month • 既存のメディアもバイラルメディア的戦略を取
り入れている – 東洋経済オンライン 1億PV/month • タイトルのリライトなどによりシェアを最大化する試み • コンテンツを共有させることに対する関心の 高まり
背景 • 既存の研究は共有された結果のみを扱っている – Tweet数からニュースの注目度を可視化・分析する [Jaewon Yang 2011]
– Tweetからユーザの興味を抽出する • [Fabian Abel 2011] • 共有行動の背景の閲覧は扱われていない – 共有はユーザが閲覧した上で共有するという意思決 定の上で起こる. – 共有の同期についてはアンケートを用いた研究は存 在するが実際の行動に基づいた研究は存在しない • [Chei Sian Lee 2012]
概要 • スマートフォンアプリケーションの行動ログか らユーザの閲覧情報と共有情報を分析する. • 共有の背景としての閲覧行動について分析 を行う – 閲覧と共有の関係性について
– 閲覧なしの共有について – 閲覧と共有が異なるユーザについて
用いたデータ[1/2] • スマートフォンアプリケーションGunosyにおけ る行動ログ – 内容 • コンテンツの閲覧
• コンテンツの共有 – データの範囲 • 2013年のある期間にシェアを活発に行なっていた 12,768人のユーザ • Gunosy上で配信されたコンテンツのタイトルと リード文
用いたデータ[2/2] • 行動データ – (記事識別子, ユーザ識別子, 行動種別, 行動時 間)
– 行動種別: 閲覧か共有化 • 記事データ – (記事識別子, 記事タイトル, リード文) – 記事タイトルやリード文は分析する際に用い,結 果として言及する際には概要のみを用いる
行動データの概要 • 86.2%が閲覧, 13.8%が共有 • 共有のうち30.6%は閲覧していないコンテンツ に対して行われている – ユーザ数としては9,055
人で今回の対象の70.9% にも登る
閲覧数上位の記事 記事の概要 1 企業経営者の不適切発言について 2 誤って子供がスマートフォンサイトで車を購入してしまった父親について 3 iOS7についての発表前の憶測記事 4 男性から印象の悪い女性の服装についてのランキング
5 話題になった新しいWebサービス・アプリの紹介 6 Facebookを楽しむコツは◦◦の写真をとること!食事でも風景でも家族でもなかっ た! 7 カバンが重い人は仕事ができないという記事 8 報・連・相についての記事 9 コンビニ経営がコンビニを閉店する理由について 10 アプリストアで無料になったアプリについてのまとめ記事
共有数上位の記事 1 地方にIT企業のサテライトオフィスができていることについて 2 報・連・相についての記事 3 居酒屋のスマホレジについて 4 日本企業におけるPDCAサイクルについて 5
iPhone, iPadアクセサリーについて 6 高校サッカー部のPVについて 7 アプリストアで無料になったアプリについてのまとめ記事 8 リーダーシップについて 9 ウェブデザインについて 10 アプリ開発サービスについて
閲覧なしで共有された数が上位の記事 1 iPhone, iPadアクセサリーについて 2 地方にIT企業のサテライトオフィスができていることについて 3 居酒屋のスマホレジについて 4 アプリストアで無料になったアプリについてのまとめ記事
5 iOSアプリのデザインについて 6 iPhoneの操作方法のTipsについて 7 有料iOSアプリの値段設定の仕様変更について 8 次世代iPhoneについての憶測記事 9 iOSアプリの課金についてのTips 10 音楽ストリーミングサービスについてのまとめ
行動データの概要 • 閲覧数が高い記事が共有数が高いわけでは ない • 共有数が高い記事が閲覧なしで共有されて いる数が多いわけではない
トピックによる分析 • LSIを用いてトピックを構成する – タイトルとリード文をMeCabにより形態素解析 – メディア名などを手動で取り除く – TF-‐IDFにより重み付けをしLSIで次元圧縮
– トピック数は300 • 最も大きなトピックに所属する記事数が全記事数の5% 以下になるように設定 13
トピックごとの閲覧数と共有数 • 正の相関がみられる • 閲覧数が高いからシェア数が高くなるというわけで はない • シェア率によってトピックごとの傾向を比較可能である
トピックごとの共有率 閲覧数が1万件を下回るトピックは計算から除いている
トピックごとの閲覧なしに共有された率 共有数が1,000件を下回るトピックは計算から除いている
トピックによる分析 • 共有率はトピックごとに異なりが見られ, 最大と 最小の比は2倍にもなる. – 共有されやすい・共有されにくいという違い •
共有されにくい: 恋愛, 炎上ネタ • 共有されやすい: 自然科学, 音楽, 健康 • 閲覧なし共有数はトピックごとで最大と最小で2.5 倍にもなる – 高いトピックは定常的にはシェア数が多くないが,一 部のコンテンツにより引き上げられている – 普段そのトピックを読まないユーザが引き上げている
ユーザとトピックによる分析 • 閲覧したトピックと共有したトピックの異なり方を 分析する • 最も閲覧したトピックと共有したトピックが異なる ユーザは4,112 人で全体の32.2%に登る
• どの組み合わせが多いかを分析する • N(v, s) – 最も閲覧したトピックがv, 最もシェアしたトピックがsの ユーザ数
• いずれの組み合わせも類似していないトピックのように見え る. • シェア率の低いコンテンツが閲覧側, シェア率の高いコンテ ンツがシェア側にきている
まとめ • 閲覧と共有について実データを用いて関係性の分析 を行った • 閲覧と共有では傾向が異なることを明らかにし,トピッ クごとに特徴があることを示した –
明らかにトピックによって閲覧したことを周りに示したい場 合とそうでない場合が存在する • 閲覧せずに共有を行われることが非常に多く,共有さ れるコンテンツにおいては一定度合いで起こる – 共有されにくいコンテンツがそのようなトピックの要素を含 んでいた場合には通常よりもより共有されることに繋がる