Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity ana...
Search
ysekky
June 01, 2015
Research
1
3.1k
スマートフォンにおけるコンテンツ閲覧と共有行動の分析 / share activity analysis in smartphone news app
人工知能学会全国大会 研究報告
ysekky
June 01, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.6k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
750
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.7k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.4k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.1k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.3k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.9k
Other Decks in Research
See All in Research
ドローンやICTを活用した持続可能なまちづくりに関する研究
nro2daisuke
0
150
インドネシアのQA事情を紹介するの
yujijs
0
100
Weekly AI Agents News!
masatoto
31
55k
医療支援AI開発における臨床と情報学の連携を円滑に進めるために
moda0
0
150
[輪講] Transformer Layers as Painters
nk35jk
4
690
言語モデルLUKEを経済の知識に特化させたモデル「UBKE-LUKE」について
petter0201
0
240
[ECCV2024読み会] 衛星画像からの地上画像生成
elith
1
1.1k
移動ビッグデータに基づく地理情報の埋め込みベクトル化
tam1110
0
240
BtoB プロダクトにおけるインサイトマネジメントの必要性 現場ドリブンなカミナシがインサイトマネジメントに取り組むワケ / Why field-driven Kaminashi is working on insight management
kaminashi
1
290
Segment Any Change
satai
3
220
LLM 시대의 Compliance: Safety & Security
huffon
0
610
한국어 오픈소스 거대 언어 모델의 가능성: 새로운 시대의 언어 이해와 생성
inureyes
PRO
0
230
Featured
See All Featured
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7.1k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
134
33k
Gamification - CAS2011
davidbonilla
80
5.2k
KATA
mclloyd
29
14k
How STYLIGHT went responsive
nonsquared
99
5.4k
Making Projects Easy
brettharned
116
6k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Thoughts on Productivity
jonyablonski
69
4.5k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
Transcript
スマートフォンにおける コンテンツ閲覧と共有行動の分析 関 喜史*1*2, 松尾豊*2 株式会社Gunosy*1, 東京大学*2
2015/06/01 人工知能学会全国大会
目次 • 背景 • 概要 • 用いたデータについて
• 閲覧とシェアの概要について • トピックモデルを用いた分析 • ユーザとトピックに関する分析 • まとめ
背景 • バイラルメディアというSNSを主要な流入経路 としたメディアの急成長 – BuzzFeed 1.5億UU/month • 既存のメディアもバイラルメディア的戦略を取
り入れている – 東洋経済オンライン 1億PV/month • タイトルのリライトなどによりシェアを最大化する試み • コンテンツを共有させることに対する関心の 高まり
背景 • 既存の研究は共有された結果のみを扱っている – Tweet数からニュースの注目度を可視化・分析する [Jaewon Yang 2011]
– Tweetからユーザの興味を抽出する • [Fabian Abel 2011] • 共有行動の背景の閲覧は扱われていない – 共有はユーザが閲覧した上で共有するという意思決 定の上で起こる. – 共有の同期についてはアンケートを用いた研究は存 在するが実際の行動に基づいた研究は存在しない • [Chei Sian Lee 2012]
概要 • スマートフォンアプリケーションの行動ログか らユーザの閲覧情報と共有情報を分析する. • 共有の背景としての閲覧行動について分析 を行う – 閲覧と共有の関係性について
– 閲覧なしの共有について – 閲覧と共有が異なるユーザについて
用いたデータ[1/2] • スマートフォンアプリケーションGunosyにおけ る行動ログ – 内容 • コンテンツの閲覧
• コンテンツの共有 – データの範囲 • 2013年のある期間にシェアを活発に行なっていた 12,768人のユーザ • Gunosy上で配信されたコンテンツのタイトルと リード文
用いたデータ[2/2] • 行動データ – (記事識別子, ユーザ識別子, 行動種別, 行動時 間)
– 行動種別: 閲覧か共有化 • 記事データ – (記事識別子, 記事タイトル, リード文) – 記事タイトルやリード文は分析する際に用い,結 果として言及する際には概要のみを用いる
行動データの概要 • 86.2%が閲覧, 13.8%が共有 • 共有のうち30.6%は閲覧していないコンテンツ に対して行われている – ユーザ数としては9,055
人で今回の対象の70.9% にも登る
閲覧数上位の記事 記事の概要 1 企業経営者の不適切発言について 2 誤って子供がスマートフォンサイトで車を購入してしまった父親について 3 iOS7についての発表前の憶測記事 4 男性から印象の悪い女性の服装についてのランキング
5 話題になった新しいWebサービス・アプリの紹介 6 Facebookを楽しむコツは◦◦の写真をとること!食事でも風景でも家族でもなかっ た! 7 カバンが重い人は仕事ができないという記事 8 報・連・相についての記事 9 コンビニ経営がコンビニを閉店する理由について 10 アプリストアで無料になったアプリについてのまとめ記事
共有数上位の記事 1 地方にIT企業のサテライトオフィスができていることについて 2 報・連・相についての記事 3 居酒屋のスマホレジについて 4 日本企業におけるPDCAサイクルについて 5
iPhone, iPadアクセサリーについて 6 高校サッカー部のPVについて 7 アプリストアで無料になったアプリについてのまとめ記事 8 リーダーシップについて 9 ウェブデザインについて 10 アプリ開発サービスについて
閲覧なしで共有された数が上位の記事 1 iPhone, iPadアクセサリーについて 2 地方にIT企業のサテライトオフィスができていることについて 3 居酒屋のスマホレジについて 4 アプリストアで無料になったアプリについてのまとめ記事
5 iOSアプリのデザインについて 6 iPhoneの操作方法のTipsについて 7 有料iOSアプリの値段設定の仕様変更について 8 次世代iPhoneについての憶測記事 9 iOSアプリの課金についてのTips 10 音楽ストリーミングサービスについてのまとめ
行動データの概要 • 閲覧数が高い記事が共有数が高いわけでは ない • 共有数が高い記事が閲覧なしで共有されて いる数が多いわけではない
トピックによる分析 • LSIを用いてトピックを構成する – タイトルとリード文をMeCabにより形態素解析 – メディア名などを手動で取り除く – TF-‐IDFにより重み付けをしLSIで次元圧縮
– トピック数は300 • 最も大きなトピックに所属する記事数が全記事数の5% 以下になるように設定 13
トピックごとの閲覧数と共有数 • 正の相関がみられる • 閲覧数が高いからシェア数が高くなるというわけで はない • シェア率によってトピックごとの傾向を比較可能である
トピックごとの共有率 閲覧数が1万件を下回るトピックは計算から除いている
トピックごとの閲覧なしに共有された率 共有数が1,000件を下回るトピックは計算から除いている
トピックによる分析 • 共有率はトピックごとに異なりが見られ, 最大と 最小の比は2倍にもなる. – 共有されやすい・共有されにくいという違い •
共有されにくい: 恋愛, 炎上ネタ • 共有されやすい: 自然科学, 音楽, 健康 • 閲覧なし共有数はトピックごとで最大と最小で2.5 倍にもなる – 高いトピックは定常的にはシェア数が多くないが,一 部のコンテンツにより引き上げられている – 普段そのトピックを読まないユーザが引き上げている
ユーザとトピックによる分析 • 閲覧したトピックと共有したトピックの異なり方を 分析する • 最も閲覧したトピックと共有したトピックが異なる ユーザは4,112 人で全体の32.2%に登る
• どの組み合わせが多いかを分析する • N(v, s) – 最も閲覧したトピックがv, 最もシェアしたトピックがsの ユーザ数
• いずれの組み合わせも類似していないトピックのように見え る. • シェア率の低いコンテンツが閲覧側, シェア率の高いコンテ ンツがシェア側にきている
まとめ • 閲覧と共有について実データを用いて関係性の分析 を行った • 閲覧と共有では傾向が異なることを明らかにし,トピッ クごとに特徴があることを示した –
明らかにトピックによって閲覧したことを周りに示したい場 合とそうでない場合が存在する • 閲覧せずに共有を行われることが非常に多く,共有さ れるコンテンツにおいては一定度合いで起こる – 共有されにくいコンテンツがそのようなトピックの要素を含 んでいた場合には通常よりもより共有されることに繋がる