Upgrade to Pro — share decks privately, control downloads, hide ads and more …

動的ネットワーク分析を用いたInstagram上のトレンド推定に関する研究 / Instagram Trend Analysis

動的ネットワーク分析を用いたInstagram上のトレンド推定に関する研究 / Instagram Trend Analysis

■概要
卒業論文では、ネットワーク科学の知見を応用したソーシャルリスニングの手法を提案しました。近年マーケティングにおいて注目が集まるソーシャルリスニングの現場では、tag cloudを用いたテキストデータの可視化が行われています。しかし、tag cloudによる可視化では、単語が置かれていた文脈や単語の出現時間は考慮されず、さらに出現頻度による評価に限界があることが問題として指摘されています。この問題を解消するべく本研究では、単語のつながりを時々刻々と変化するネットワーク(テンポラル・ネットワーク)で表現し、テンポラル・ネットワークの分析手法を適用することで有用な示唆が得られるのではないかと考えました。実際、Instagramの投稿データを分析した結果、使用した分析モデルの妥当性が確認され、統計的に有意なつながりから形成されるネットワーク(バックボーン)を抽出することができました。このネットワークのバックボーンはInstagram上に現れたトレンドに対応すると考えられ、本手法によってInstagramのトレンドをハッシュタグの出現頻度を考慮して文脈を保存したまま、統計的に推定することができると期待できます。

■GitHubリポジトリ
https://github.com/Nagayu71/Instagram-Trend-Analysis.git

Yuki Iwanaga

March 24, 2023
Tweet

More Decks by Yuki Iwanaga

Other Decks in Research

Transcript

  1. 動的ネットワーク分析を用いた
    Instagram上のトレンド推定に関する研究
    2023年2月8日 卒業研究報告会
    国際人間科学部 グローバル文化学科
    社会動態プログラム モダニティ論クラスタ
    岩永悠希

    View Slide

  2. 目次
    1
    研究背景
    1. マーケティングで注目を集めるソーシャルリスニング
    2. 可視化ツールtag cloudの問題点
    3. 要点:単語のつながりをネットワークで表現→つながりを統計的に評価
    提案手法
    1. Temporal fitness model, i.e., ST filter (Kobayashi et al., 2019)
    2. Instagramデータの収集
    3. Instagramデータへの適用方法
    結果と考察
    1. 人気者はますます人気に(スケールフリー・ネットワーク)
    2-A. モデルが導く理論値と観測値の一致
    2-B. ST filterによるsignificant tiesの抽出結果
    まとめ
    本研究のまとめ
    参考文献

    View Slide

  3. 研究背景
    2

    View Slide

  4. 1. マーケティングで注目を集めるソーシャルリスニング
    3
    ソーシャルメディア上の消費者の声(本音)を収集・分析し,マーケティングに活用
    活用
    現状把握:
    ⚫ 自社評価
    ⚫ トレンド把握
    将来予測:
    ⚫ トレンド予測
    ⚫ 市場予測
    分析
    投稿の収集

    View Slide

  5. 1. マーケティングで注目を集めるソーシャルリスニング
    4
    ソーシャルメディア上の消費者の声(本音)を収集・分析し,マーケティングに活用
    活用
    現状把握:
    ⚫ 自社評価
    ⚫ トレンド把握
    将来予測:
    ⚫ トレンド予測
    ⚫ 市場予測
    分析
    投稿の収集
    Tag cloudで消費者の声を大雑把に把握.でも,「大雑把」では満足できない…

    View Slide

  6. 2. 可視化ツールtag cloudの問題点
    5
    Tag cloudに寄せられる不満の声
    ▍不満は残る
    ⚫ 膨大な情報量→使用者の負担(Hearst et al., 2008)
    ⚫ 結局,文脈を保存できない(Cui et al., 2010)
    ▍解決を試みた研究
    アニメーションを作れば良い(Dubinko et al., 2007)
    ▍問題
    ⚫ 文脈が保存されず,単語のつながりがわからない(McNaught et al., 2010)
    ⚫ 単語の出現速度や出現が集中した期間を考慮しない
    ⚫ 出現頻度だけで重要性を評価するのは不適切(Steele et al., 2010)

    View Slide

  7. 2. 可視化ツールtag cloudの問題点
    6
    本研究はトレンド把握における「文脈の保存・時間情報の考慮・評価軸の改善」を目指す
    Tag cloudに寄せられる不満の声
    ▍不満は残る
    ⚫ 膨大な情報量→使用者の負担(Hearst et al., 2008)
    ⚫ 結局,文脈を保存できない(Cui et al., 2010)
    ▍解決を試みた研究
    アニメーションを作れば良い(Dubinko et al., 2007)
    ▍問題
    ⚫ 文脈が保存されず,単語のつながりがわからない(McNaught et al., 2010)
    ⚫ 単語の出現速度や出現が集中した期間を考慮しない
    ⚫ 出現頻度だけで重要性を評価するのは不適切(Steele et al., 2010)

    View Slide

  8. 3. 要点:単語のつながりをネットワークで表現→つながりを統計的に評価
    7
    #神戸と一緒に使用された
    ハッシュタグのつながり

    View Slide

  9. 3. 要点:単語のつながりをネットワークで表現→つながりを統計的に評価
    8
    #神戸と一緒に使用された
    ハッシュタグのつながり
    偶然の発生で説明できない
    つながりを抽出
    Statistical
    test

    View Slide

  10. 3. 要点:単語のつながりをネットワークで表現→つながりを統計的に評価
    9
    #神戸と一緒に使用された
    ハッシュタグのつながり
    偶然の発生で説明できない
    つながりを抽出
    Statistical
    test
    出現頻度の低い
    新しいハッシュタグも捕捉可能
    アトア atoa
    水族館
    Popular hashtag
    Newcomer

    View Slide

  11. 提案手法
    10

    View Slide

  12. 1. Temporal fitness model, i.e., ST filter (Kobayashi et al., 2019)
    11
    ① ②


    テンポラル・ネットワークから統計的に有意なつながり(significant tie)を抽出する手法

    View Slide

  13. 2. Instagramデータの収集
    12
    #アニメ #コーデ #ダイエット
    #ええじゃろ広島の秋2022 #新海誠 #チーズ
    #関西旅行 #じゃけぇ広島に恋しとる #紅葉
    #キャンペーン #スイーツ #ワールドカップ
    #神戸 #スターバックス #universitylife
    ▍収集期間
    9日間:2022/11/21 – 2022/11/29
    ▍実行間隔
    30分に1回、APIにリクエストを送信
    ▍取得対象
    下記のハッシュタグを用いたハッシュタグ検索(最新投稿)
    Instagram Graph APIを用いたデータの収集

    View Slide

  14. 3. Instagramデータへの適用方法
    13
    Step 1:投稿とハッシュタグの関係をタイムスタンプ付き2部グラフで表現

    View Slide

  15. 3. Instagramデータへの適用方法
    14
    Step 1:投稿とハッシュタグの関係をタイムスタンプ付き2部グラフで表現
    2部グラフで表現

    View Slide

  16. 3. Instagramデータへの適用方法
    15
    Step 1:投稿とハッシュタグの関係をタイムスタンプ付き2部グラフで表現
    2部グラフで表現
    タイムスタンプ付きのリンク

    View Slide

  17. 3. Instagramデータへの適用方法
    16
    Step 2:2部グラフを時間間隔𝚫で分解→各スナップショットを射影(projection)

    View Slide

  18. 3. Instagramデータへの適用方法
    17
    Step 2:2部グラフを時間間隔𝚫で分解→各スナップショットを射影(projection)

    View Slide

  19. 3. Instagramデータへの適用方法
    18
    Step 2:2部グラフを時間間隔𝚫で分解→各スナップショットを射影(projection)
    Projection

    View Slide

  20. 3. Instagramデータへの適用方法
    19
    Step 2:2部グラフを時間間隔𝚫で分解→各スナップショットを射影(projection)
    Projection
    時間𝚫内に同じ投稿に現れたハッシュタグがつながったネットワークを𝝉個取得

    View Slide

  21. 3. Instagramデータへの適用方法
    20
    Step 3:ハッシュタグの人気度を最尤推定→推定値をもとに各リンクを検定

    View Slide

  22. 結果と考察
    21

    View Slide

  23. 1. 人気者はますます人気に(スケールフリー・ネットワーク)
    22
    両対数軸の次数分布に線形の関係.べき指数𝜸について𝟐 < 𝜸 < 𝟑が成立.
    次数分布: (直線)
    (特定のスケールを持たない)
    スケールフリー性:

    View Slide

  24. 2-A. モデルが導く理論値と観測値の一致
    23
    Temporal fitness modelのモデルとしての妥当性を確認
    理論値: 観測値:

    View Slide

  25. 2-B. ST filterによるsignificant tiesの抽出結果
    24
    補正した有意水準𝜶 = 𝟎. 𝟎𝟎𝟏で元のリンク数の10%以下のsignificant tiesを抽出

    View Slide

  26. 2-B. ST filterによるsignificant tiesの抽出結果
    25
    Significant tiesはネットワークのバックボーン(トレンド)を形成
    Temporally aggregated network (TAN)

    View Slide

  27. 2-B. ST filterによるsignificant tiesの抽出結果
    26
    Significant tiesはネットワークのバックボーン(トレンド)を形成
    ST filter
    Temporally aggregated network (TAN)

    View Slide

  28. 2-B. ST filterによるsignificant tiesの抽出結果
    27
    Significant tiesはネットワークのバックボーン(トレンド)を形成
    ST filter
    Backbone of TAN
    Temporally aggregated network (TAN)

    View Slide

  29. 2-B. ST filterによるsignificant tiesの抽出結果
    28
    コミュニティはトピックに対応.階層的な構造はトピック同士の関係性を反映.
    Giant component Hierarchical block structure
    イラスト・デザイン
    ファッション
    グルメ
    アクセサリー
    美容・美意識
    自動車

    View Slide

  30. まとめ
    29

    View Slide

  31. 本研究のまとめ
    30
    ▍目的
    「文脈の保存・時間情報の考慮・評価軸の改善」を満たしたInstagram上のトレンド推定
    ▍提案手法
    ST filter (Kobayashi et al., 2019)をInstagramデータに適用
    ▍結果
    ⚫ ハッシュタグ・ネットワークのスケールフリー性を確認
    ⚫ Temporal fitness modelのモデルとしての妥当性を確認
    ⚫ ST filterのInstagramデータへの適用可能性を確認
    ▍今後の課題
    ⚫ 本当にトレンドを捕捉しているのか検証
    ⚫ ハッシュタグごとの最適な時間間隔𝚫を調査
    ⚫ ネットワークサイズ𝑁に関するスケーラビリティの確保

    View Slide

  32. 参考文献
    31
    ◼ Cui, W., Wu, Y., Liu, S., Wei, F., Zhou, M. X., & Qu, H. (2010, March). Context
    preserving dynamic word cloud visualization. In 2010 IEEE Pacific Visualization
    Symposium (PacificVis) (pp. 121-128). IEEE.
    ◼ Dubinko, M., Kumar, R., Magnani, J., Novak, J., Raghavan, P., & Tomkins, A.
    (2007). Visualizing tags over time. ACM Transactions on the Web (TWEB), 1(2),
    7-es.
    ◼ Hearst, M. A., & Rosner, D. (2008, January). Tag clouds: Data analysis tool or
    social signaller?. In Proceedings of the 41st Annual Hawaii International
    Conference on System Sciences (HICSS 2008) (pp. 160-160). IEEE.
    ◼ Kobayashi, T., Takaguchi, T., & Barrat, A. (2019). The structured backbone of
    temporal social ties. Nature communications, 10(1), 220.
    ◼ McNaught, C., & Lam, P. (2010). Using Wordle as a supplementary research tool.
    Qualitative Report, 15(3), 630-643.
    ◼ Steele, J., & Iliinsky, N. (2010). Beautiful visualization: Looking at data through
    the eyes of experts. " O'Reilly Media, Inc.".

    View Slide