Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
スマートフォンにおける コンテンツ閲覧と共有行動の分析 関 喜史*1*2, 松尾豊*2 株式会社Gunosy*1, 東京大学*2 2015/06/01 人工知能学会全国大会
Slide 2
Slide 2 text
目次 • 背景 • 概要 • 用いたデータについて • 閲覧とシェアの概要について • トピックモデルを用いた分析 • ユーザとトピックに関する分析 • まとめ
Slide 3
Slide 3 text
背景 • バイラルメディアというSNSを主要な流入経路 としたメディアの急成長 – BuzzFeed 1.5億UU/month • 既存のメディアもバイラルメディア的戦略を取 り入れている – 東洋経済オンライン 1億PV/month • タイトルのリライトなどによりシェアを最大化する試み • コンテンツを共有させることに対する関心の 高まり
Slide 4
Slide 4 text
背景 • 既存の研究は共有された結果のみを扱っている – Tweet数からニュースの注目度を可視化・分析する [Jaewon Yang 2011] – Tweetからユーザの興味を抽出する • [Fabian Abel 2011] • 共有行動の背景の閲覧は扱われていない – 共有はユーザが閲覧した上で共有するという意思決 定の上で起こる. – 共有の同期についてはアンケートを用いた研究は存 在するが実際の行動に基づいた研究は存在しない • [Chei Sian Lee 2012]
Slide 5
Slide 5 text
概要 • スマートフォンアプリケーションの行動ログか らユーザの閲覧情報と共有情報を分析する. • 共有の背景としての閲覧行動について分析 を行う – 閲覧と共有の関係性について – 閲覧なしの共有について – 閲覧と共有が異なるユーザについて
Slide 6
Slide 6 text
用いたデータ[1/2] • スマートフォンアプリケーションGunosyにおけ る行動ログ – 内容 • コンテンツの閲覧 • コンテンツの共有 – データの範囲 • 2013年のある期間にシェアを活発に行なっていた 12,768人のユーザ • Gunosy上で配信されたコンテンツのタイトルと リード文
Slide 7
Slide 7 text
用いたデータ[2/2] • 行動データ – (記事識別子, ユーザ識別子, 行動種別, 行動時 間) – 行動種別: 閲覧か共有化 • 記事データ – (記事識別子, 記事タイトル, リード文) – 記事タイトルやリード文は分析する際に用い,結 果として言及する際には概要のみを用いる
Slide 8
Slide 8 text
行動データの概要 • 86.2%が閲覧, 13.8%が共有 • 共有のうち30.6%は閲覧していないコンテンツ に対して行われている – ユーザ数としては9,055 人で今回の対象の70.9% にも登る
Slide 9
Slide 9 text
閲覧数上位の記事 記事の概要 1 企業経営者の不適切発言について 2 誤って子供がスマートフォンサイトで車を購入してしまった父親について 3 iOS7についての発表前の憶測記事 4 男性から印象の悪い女性の服装についてのランキング 5 話題になった新しいWebサービス・アプリの紹介 6 Facebookを楽しむコツは○○の写真をとること!食事でも風景でも家族でもなかっ た! 7 カバンが重い人は仕事ができないという記事 8 報・連・相についての記事 9 コンビニ経営がコンビニを閉店する理由について 10 アプリストアで無料になったアプリについてのまとめ記事
Slide 10
Slide 10 text
共有数上位の記事 1 地方にIT企業のサテライトオフィスができていることについて 2 報・連・相についての記事 3 居酒屋のスマホレジについて 4 日本企業におけるPDCAサイクルについて 5 iPhone, iPadアクセサリーについて 6 高校サッカー部のPVについて 7 アプリストアで無料になったアプリについてのまとめ記事 8 リーダーシップについて 9 ウェブデザインについて 10 アプリ開発サービスについて
Slide 11
Slide 11 text
閲覧なしで共有された数が上位の記事 1 iPhone, iPadアクセサリーについて 2 地方にIT企業のサテライトオフィスができていることについて 3 居酒屋のスマホレジについて 4 アプリストアで無料になったアプリについてのまとめ記事 5 iOSアプリのデザインについて 6 iPhoneの操作方法のTipsについて 7 有料iOSアプリの値段設定の仕様変更について 8 次世代iPhoneについての憶測記事 9 iOSアプリの課金についてのTips 10 音楽ストリーミングサービスについてのまとめ
Slide 12
Slide 12 text
行動データの概要 • 閲覧数が高い記事が共有数が高いわけでは ない • 共有数が高い記事が閲覧なしで共有されて いる数が多いわけではない
Slide 13
Slide 13 text
トピックによる分析 • LSIを用いてトピックを構成する – タイトルとリード文をMeCabにより形態素解析 – メディア名などを手動で取り除く – TF-‐IDFにより重み付けをしLSIで次元圧縮 – トピック数は300 • 最も大きなトピックに所属する記事数が全記事数の5% 以下になるように設定 13
Slide 14
Slide 14 text
トピックごとの閲覧数と共有数 • 正の相関がみられる • 閲覧数が高いからシェア数が高くなるというわけで はない • シェア率によってトピックごとの傾向を比較可能である
Slide 15
Slide 15 text
トピックごとの共有率 閲覧数が1万件を下回るトピックは計算から除いている
Slide 16
Slide 16 text
トピックごとの閲覧なしに共有された率 共有数が1,000件を下回るトピックは計算から除いている
Slide 17
Slide 17 text
トピックによる分析 • 共有率はトピックごとに異なりが見られ, 最大と 最小の比は2倍にもなる. – 共有されやすい・共有されにくいという違い • 共有されにくい: 恋愛, 炎上ネタ • 共有されやすい: 自然科学, 音楽, 健康 • 閲覧なし共有数はトピックごとで最大と最小で2.5 倍にもなる – 高いトピックは定常的にはシェア数が多くないが,一 部のコンテンツにより引き上げられている – 普段そのトピックを読まないユーザが引き上げている
Slide 18
Slide 18 text
ユーザとトピックによる分析 • 閲覧したトピックと共有したトピックの異なり方を 分析する • 最も閲覧したトピックと共有したトピックが異なる ユーザは4,112 人で全体の32.2%に登る • どの組み合わせが多いかを分析する • N(v, s) – 最も閲覧したトピックがv, 最もシェアしたトピックがsの ユーザ数
Slide 19
Slide 19 text
• いずれの組み合わせも類似していないトピックのように見え る. • シェア率の低いコンテンツが閲覧側, シェア率の高いコンテ ンツがシェア側にきている
Slide 20
Slide 20 text
まとめ • 閲覧と共有について実データを用いて関係性の分析 を行った • 閲覧と共有では傾向が異なることを明らかにし,トピッ クごとに特徴があることを示した – 明らかにトピックによって閲覧したことを周りに示したい場 合とそうでない場合が存在する • 閲覧せずに共有を行われることが非常に多く,共有さ れるコンテンツにおいては一定度合いで起こる – 共有されにくいコンテンツがそのようなトピックの要素を含 んでいた場合には通常よりもより共有されることに繋がる