Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity ana...
Search
ysekky
June 01, 2015
Research
0
3.1k
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity analysis in smartphone news app
人工知能学会全国大会 研究報告
ysekky
June 01, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
1.8k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.5k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
1.9k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
720
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.6k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.3k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
940
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.2k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.8k
Other Decks in Research
See All in Research
Generative Predictive Model for Autonomous Driving 第61回 コンピュータビジョン勉強会@関東 (後編)
kentosasaki
0
160
Language is primarily a tool for communication rather than thought
ryou0634
4
630
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
100
20240725異文化融合研究セミナーiSeminar
tadook
0
120
いしかわ暮らしセミナー~移住にまつわるお金の話~
matyuda
0
110
システムから変える 自分と世界を変えるシステムチェンジの方法論 / Systems Change Approaches
dmattsun
3
200
初めての研究発表を成功させよう! スライド作成の基本
ayaco0
11
4.4k
LINEチャットボット「全力肯定彼氏くん(LuC4)」の 1年を振り返る
o_ob
0
1.3k
RCEへの近道
kawakatz
1
740
論文読み会 SNLP2024 Instruction-tuned Language Models are Better Knowledge Learners. In: ACL 2024
s_mizuki_nlp
1
260
SSII2024 [OS2] 画像、その先へ 〜モーション解析への誘い〜
ssii
PRO
1
1.2k
独立成分分析を用いた埋め込み表現の視覚的な理解
momoseoyama
4
900
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
508
110k
How to Think Like a Performance Engineer
csswizardry
16
940
Web Components: a chance to create the future
zenorocha
308
41k
Docker and Python
trallard
39
3k
Fantastic passwords and where to find them - at NoRuKo
philnash
48
2.8k
Product Roadmaps are Hard
iamctodd
PRO
48
10k
Writing Fast Ruby
sferik
623
60k
[RailsConf 2023] Rails as a piece of cake
palkan
46
4.6k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
34
1.7k
4 Signs Your Business is Dying
shpigford
179
21k
How To Stay Up To Date on Web Technology
chriscoyier
786
250k
The Invisible Side of Design
smashingmag
295
50k
Transcript
スマートフォンにおける コンテンツ閲覧と共有行動の分析 関 喜史*1*2, 松尾豊*2 株式会社Gunosy*1, 東京大学*2
2015/06/01 人工知能学会全国大会
目次 • 背景 • 概要 • 用いたデータについて
• 閲覧とシェアの概要について • トピックモデルを用いた分析 • ユーザとトピックに関する分析 • まとめ
背景 • バイラルメディアというSNSを主要な流入経路 としたメディアの急成長 – BuzzFeed 1.5億UU/month • 既存のメディアもバイラルメディア的戦略を取
り入れている – 東洋経済オンライン 1億PV/month • タイトルのリライトなどによりシェアを最大化する試み • コンテンツを共有させることに対する関心の 高まり
背景 • 既存の研究は共有された結果のみを扱っている – Tweet数からニュースの注目度を可視化・分析する [Jaewon Yang 2011]
– Tweetからユーザの興味を抽出する • [Fabian Abel 2011] • 共有行動の背景の閲覧は扱われていない – 共有はユーザが閲覧した上で共有するという意思決 定の上で起こる. – 共有の同期についてはアンケートを用いた研究は存 在するが実際の行動に基づいた研究は存在しない • [Chei Sian Lee 2012]
概要 • スマートフォンアプリケーションの行動ログか らユーザの閲覧情報と共有情報を分析する. • 共有の背景としての閲覧行動について分析 を行う – 閲覧と共有の関係性について
– 閲覧なしの共有について – 閲覧と共有が異なるユーザについて
用いたデータ[1/2] • スマートフォンアプリケーションGunosyにおけ る行動ログ – 内容 • コンテンツの閲覧
• コンテンツの共有 – データの範囲 • 2013年のある期間にシェアを活発に行なっていた 12,768人のユーザ • Gunosy上で配信されたコンテンツのタイトルと リード文
用いたデータ[2/2] • 行動データ – (記事識別子, ユーザ識別子, 行動種別, 行動時 間)
– 行動種別: 閲覧か共有化 • 記事データ – (記事識別子, 記事タイトル, リード文) – 記事タイトルやリード文は分析する際に用い,結 果として言及する際には概要のみを用いる
行動データの概要 • 86.2%が閲覧, 13.8%が共有 • 共有のうち30.6%は閲覧していないコンテンツ に対して行われている – ユーザ数としては9,055
人で今回の対象の70.9% にも登る
閲覧数上位の記事 記事の概要 1 企業経営者の不適切発言について 2 誤って子供がスマートフォンサイトで車を購入してしまった父親について 3 iOS7についての発表前の憶測記事 4 男性から印象の悪い女性の服装についてのランキング
5 話題になった新しいWebサービス・アプリの紹介 6 Facebookを楽しむコツは◦◦の写真をとること!食事でも風景でも家族でもなかっ た! 7 カバンが重い人は仕事ができないという記事 8 報・連・相についての記事 9 コンビニ経営がコンビニを閉店する理由について 10 アプリストアで無料になったアプリについてのまとめ記事
共有数上位の記事 1 地方にIT企業のサテライトオフィスができていることについて 2 報・連・相についての記事 3 居酒屋のスマホレジについて 4 日本企業におけるPDCAサイクルについて 5
iPhone, iPadアクセサリーについて 6 高校サッカー部のPVについて 7 アプリストアで無料になったアプリについてのまとめ記事 8 リーダーシップについて 9 ウェブデザインについて 10 アプリ開発サービスについて
閲覧なしで共有された数が上位の記事 1 iPhone, iPadアクセサリーについて 2 地方にIT企業のサテライトオフィスができていることについて 3 居酒屋のスマホレジについて 4 アプリストアで無料になったアプリについてのまとめ記事
5 iOSアプリのデザインについて 6 iPhoneの操作方法のTipsについて 7 有料iOSアプリの値段設定の仕様変更について 8 次世代iPhoneについての憶測記事 9 iOSアプリの課金についてのTips 10 音楽ストリーミングサービスについてのまとめ
行動データの概要 • 閲覧数が高い記事が共有数が高いわけでは ない • 共有数が高い記事が閲覧なしで共有されて いる数が多いわけではない
トピックによる分析 • LSIを用いてトピックを構成する – タイトルとリード文をMeCabにより形態素解析 – メディア名などを手動で取り除く – TF-‐IDFにより重み付けをしLSIで次元圧縮
– トピック数は300 • 最も大きなトピックに所属する記事数が全記事数の5% 以下になるように設定 13
トピックごとの閲覧数と共有数 • 正の相関がみられる • 閲覧数が高いからシェア数が高くなるというわけで はない • シェア率によってトピックごとの傾向を比較可能である
トピックごとの共有率 閲覧数が1万件を下回るトピックは計算から除いている
トピックごとの閲覧なしに共有された率 共有数が1,000件を下回るトピックは計算から除いている
トピックによる分析 • 共有率はトピックごとに異なりが見られ, 最大と 最小の比は2倍にもなる. – 共有されやすい・共有されにくいという違い •
共有されにくい: 恋愛, 炎上ネタ • 共有されやすい: 自然科学, 音楽, 健康 • 閲覧なし共有数はトピックごとで最大と最小で2.5 倍にもなる – 高いトピックは定常的にはシェア数が多くないが,一 部のコンテンツにより引き上げられている – 普段そのトピックを読まないユーザが引き上げている
ユーザとトピックによる分析 • 閲覧したトピックと共有したトピックの異なり方を 分析する • 最も閲覧したトピックと共有したトピックが異なる ユーザは4,112 人で全体の32.2%に登る
• どの組み合わせが多いかを分析する • N(v, s) – 最も閲覧したトピックがv, 最もシェアしたトピックがsの ユーザ数
• いずれの組み合わせも類似していないトピックのように見え る. • シェア率の低いコンテンツが閲覧側, シェア率の高いコンテ ンツがシェア側にきている
まとめ • 閲覧と共有について実データを用いて関係性の分析 を行った • 閲覧と共有では傾向が異なることを明らかにし,トピッ クごとに特徴があることを示した –
明らかにトピックによって閲覧したことを周りに示したい場 合とそうでない場合が存在する • 閲覧せずに共有を行われることが非常に多く,共有さ れるコンテンツにおいては一定度合いで起こる – 共有されにくいコンテンツがそのようなトピックの要素を含 んでいた場合には通常よりもより共有されることに繋がる