Slide 1

Slide 1 text

スマートフォンにおける   コンテンツ閲覧と共有行動の分析 関 喜史*1*2,  松尾豊*2   株式会社Gunosy*1,  東京大学*2   2015/06/01  人工知能学会全国大会

Slide 2

Slide 2 text

目次 •  背景   •  概要   •  用いたデータについて   •  閲覧とシェアの概要について   •  トピックモデルを用いた分析   •  ユーザとトピックに関する分析   •  まとめ

Slide 3

Slide 3 text

背景 •  バイラルメディアというSNSを主要な流入経路 としたメディアの急成長   – BuzzFeed  1.5億UU/month   •  既存のメディアもバイラルメディア的戦略を取 り入れている   – 東洋経済オンライン  1億PV/month   •  タイトルのリライトなどによりシェアを最大化する試み   •  コンテンツを共有させることに対する関心の 高まり  

Slide 4

Slide 4 text

背景 •  既存の研究は共有された結果のみを扱っている   –  Tweet数からニュースの注目度を可視化・分析する  [Jaewon  Yang  2011]   –  Tweetからユーザの興味を抽出する   •  [Fabian  Abel  2011]   •  共有行動の背景の閲覧は扱われていない   –  共有はユーザが閲覧した上で共有するという意思決 定の上で起こる.   –  共有の同期についてはアンケートを用いた研究は存 在するが実際の行動に基づいた研究は存在しない   •  [Chei  Sian  Lee  2012]  

Slide 5

Slide 5 text

概要 •  スマートフォンアプリケーションの行動ログか らユーザの閲覧情報と共有情報を分析する.   •  共有の背景としての閲覧行動について分析 を行う   – 閲覧と共有の関係性について   – 閲覧なしの共有について   – 閲覧と共有が異なるユーザについて  

Slide 6

Slide 6 text

用いたデータ[1/2] •  スマートフォンアプリケーションGunosyにおけ る行動ログ   – 内容   •  コンテンツの閲覧   •  コンテンツの共有   – データの範囲   •  2013年のある期間にシェアを活発に行なっていた 12,768人のユーザ   •  Gunosy上で配信されたコンテンツのタイトルと リード文

Slide 7

Slide 7 text

用いたデータ[2/2] •  行動データ   – (記事識別子,  ユーザ識別子,  行動種別,  行動時 間)   – 行動種別:  閲覧か共有化   •  記事データ   – (記事識別子,  記事タイトル,  リード文)   – 記事タイトルやリード文は分析する際に用い,結 果として言及する際には概要のみを用いる  

Slide 8

Slide 8 text

行動データの概要 •  86.2%が閲覧,  13.8%が共有   •  共有のうち30.6%は閲覧していないコンテンツ に対して行われている   – ユーザ数としては9,055  人で今回の対象の70.9% にも登る  

Slide 9

Slide 9 text

閲覧数上位の記事 記事の概要 1 企業経営者の不適切発言について 2 誤って子供がスマートフォンサイトで車を購入してしまった父親について 3 iOS7についての発表前の憶測記事 4 男性から印象の悪い女性の服装についてのランキング 5 話題になった新しいWebサービス・アプリの紹介 6 Facebookを楽しむコツは○○の写真をとること!食事でも風景でも家族でもなかっ た! 7 カバンが重い人は仕事ができないという記事 8 報・連・相についての記事 9 コンビニ経営がコンビニを閉店する理由について 10 アプリストアで無料になったアプリについてのまとめ記事

Slide 10

Slide 10 text

共有数上位の記事 1 地方にIT企業のサテライトオフィスができていることについて 2 報・連・相についての記事 3 居酒屋のスマホレジについて 4 日本企業におけるPDCAサイクルについて 5 iPhone, iPadアクセサリーについて 6 高校サッカー部のPVについて 7 アプリストアで無料になったアプリについてのまとめ記事 8 リーダーシップについて 9 ウェブデザインについて 10 アプリ開発サービスについて

Slide 11

Slide 11 text

閲覧なしで共有された数が上位の記事 1 iPhone, iPadアクセサリーについて 2 地方にIT企業のサテライトオフィスができていることについて 3 居酒屋のスマホレジについて 4 アプリストアで無料になったアプリについてのまとめ記事 5 iOSアプリのデザインについて 6 iPhoneの操作方法のTipsについて 7 有料iOSアプリの値段設定の仕様変更について 8 次世代iPhoneについての憶測記事 9 iOSアプリの課金についてのTips 10 音楽ストリーミングサービスについてのまとめ

Slide 12

Slide 12 text

行動データの概要 •  閲覧数が高い記事が共有数が高いわけでは ない   •  共有数が高い記事が閲覧なしで共有されて いる数が多いわけではない

Slide 13

Slide 13 text

トピックによる分析 •  LSIを用いてトピックを構成する   – タイトルとリード文をMeCabにより形態素解析   – メディア名などを手動で取り除く   – TF-­‐IDFにより重み付けをしLSIで次元圧縮   – トピック数は300   •  最も大きなトピックに所属する記事数が全記事数の5% 以下になるように設定 13

Slide 14

Slide 14 text

トピックごとの閲覧数と共有数 •  正の相関がみられる   •  閲覧数が高いからシェア数が高くなるというわけで はない   •  シェア率によってトピックごとの傾向を比較可能である

Slide 15

Slide 15 text

トピックごとの共有率 閲覧数が1万件を下回るトピックは計算から除いている

Slide 16

Slide 16 text

トピックごとの閲覧なしに共有された率 共有数が1,000件を下回るトピックは計算から除いている

Slide 17

Slide 17 text

トピックによる分析 •  共有率はトピックごとに異なりが見られ,  最大と 最小の比は2倍にもなる.   –  共有されやすい・共有されにくいという違い   •  共有されにくい:  恋愛,  炎上ネタ   •  共有されやすい:  自然科学,  音楽,  健康   •  閲覧なし共有数はトピックごとで最大と最小で2.5 倍にもなる   –  高いトピックは定常的にはシェア数が多くないが,一 部のコンテンツにより引き上げられている   –  普段そのトピックを読まないユーザが引き上げている  

Slide 18

Slide 18 text

ユーザとトピックによる分析 •  閲覧したトピックと共有したトピックの異なり方を 分析する   •  最も閲覧したトピックと共有したトピックが異なる ユーザは4,112  人で全体の32.2%に登る   •  どの組み合わせが多いかを分析する   •  N(v,  s)   –  最も閲覧したトピックがv,  最もシェアしたトピックがsの ユーザ数  

Slide 19

Slide 19 text

•  いずれの組み合わせも類似していないトピックのように見え る.   •  シェア率の低いコンテンツが閲覧側,  シェア率の高いコンテ ンツがシェア側にきている  

Slide 20

Slide 20 text

まとめ •  閲覧と共有について実データを用いて関係性の分析 を行った   •  閲覧と共有では傾向が異なることを明らかにし,トピッ クごとに特徴があることを示した   –  明らかにトピックによって閲覧したことを周りに示したい場 合とそうでない場合が存在する   •  閲覧せずに共有を行われることが非常に多く,共有さ れるコンテンツにおいては一定度合いで起こる   –  共有されにくいコンテンツがそのようなトピックの要素を含 んでいた場合には通常よりもより共有されることに繋がる