Upgrade to Pro — share decks privately, control downloads, hide ads and more …

サイバーエージェントの広告配信におけるIPoEトラフィックの概況

Kurochan
December 01, 2023

 サイバーエージェントの広告配信におけるIPoEトラフィックの概況

IPoE協議会 第15回 拡大理事会でお話ししました

Kurochan

December 01, 2023
Tweet

More Decks by Kurochan

Other Decks in Technology

Transcript

  1. サイバーエージェントの広告配信における
    IPoEトラフィックの概況
    株式会社サイバーエージェント CTO統括室
    黒崎 優太 (@kuro_m )
    @IPoE協議会 第15回 拡⼤理事会

    View full-size slide

  2. ࠇ࡚ ༏ଠ
    גࣜձࣾαΠόʔΤʔδΣϯτ AIࣄۀຊ෦
    @kurochan
    @kuro_m88
    αΠόʔΤʔδΣϯτ CTO౷ׅࣨ

    View full-size slide

  3. インターネットゼミ
    • インターネットの勉強をするゼミ
    • 社内ゼミ制度
    • サイバーエージェントの実験⽤ASであるAS を運⽤しています

    View full-size slide

  4. 実験概要

    View full-size slide

  5. 実験概要
    • 環境
    • サイバーエージェントの広告配信プラットフォームの⼀部
    • 主にスマートフォン(iOS/Android)向けの広告配信
    • 期間
    • 2023年11⽉20⽇〜11⽉24⽇
    • ⼿法
    • jsファイルのCDNの配信ログをIPoE協議会より提供頂いたプレフィックス情報と突合

    View full-size slide

  6. 広告配信の概要

    View full-size slide

  7. ⽇本の媒体別広告宣伝費
    https://www.cyberagent.co.jp/ir/superiority/internetad/

    View full-size slide

  8. ログの採取

    View full-size slide

  9. ログの採取
    • CDN(Amazon CloudFront)で配信されているjsファイルの配信ログを採取
    • 今回はTimestamp、UserAgent、ClientIPのみ利⽤
    • ログはAmazon S に保存
    https://docs.aws.amazon.com/ja_jp/AmazonCloudFront/latest/DeveloperGuide/AccessLogs.html

    View full-size slide

  10. データの処理

    View full-size slide

  11. データの処理
    • S に保存された配信ログをSnowflake(DWH)に取り込む
    • IPoEのprefix情報をSnowflakeに取り込む

    View full-size slide

  12. ログのパース⽅法

    View full-size slide

  13. ログの例

    View full-size slide

  14. 分析⽤テーブルの作成

    View full-size slide

  15. 時間帯別IPv ⽐率
    • 平均57%

    View full-size slide

  16. 時間帯別IPv ⽐率(OS別)
    • iOSがほぼ均⼀なのに対し、Androidが深夜IPv ⽐率が下がるのが気になる
    • タイムスタンプはUTC

    View full-size slide

  17. 時間帯別IPoE⽐率(OS別)
    • 両⽅OSとも⽇中IPoE⽐率が下がっていることがわかる
    • IPoE⽐率 = 地域判定できたトラフィック / 全トラフィック
    • prefix情報未提供のprefixはIPoEとして判定できていない

    View full-size slide

  18. 地域判定の結果

    View full-size slide

  19. 地域判定の結果(上位を拡⼤)
    • ⼈⼝⽐率におおよそ類似しているように⾒える

    View full-size slide

  20. わかったこと
    • IPv ⽐率
    • 概ね60%前後のトラフィックがIPv になっている
    • IPoE⽐率
    • 概ね20%前後のトラフィックがIPoE経由になっている
    • 昼間はIPoE⽐率が低い
    • Private Relay⽐率
    • 今回の対象トラフィックにおいてはほぼ検出できず
    • 今回取り扱っていないがメールに関してはこの限りではない(iCloud+未契約ユーザも⾃動適⽤)
    • 広告配信に活⽤できそうか?
    • 次ページ

    View full-size slide

  21. 広告配信に使えそうか?
    • ほぼ確実に都道府県の判定ができるトラフィックが20%以上あるため
    分析⽤途では活⽤できそう
    • 地域限定配信のデータソースとしてこの情報のみ利⽤するには少ない
    ˝ ☽סظ٭ذخ٭ت (FP*1םל
    כ磝ײ⺬؂׎׾סעؓٛ
    • 市区町村粒度まで取れると他のデータソースと差別化ができそう
    • どの粒度までなら匿名性が⼗分に担保できているかの議論の余地がありそう

    View full-size slide