Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
Search
bootjp / ぶーと
November 03, 2025
Research
640
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp / ぶーと
November 03, 2025
More Decks by bootjp / ぶーと
See All by bootjp / ぶーと
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.7k
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
690
パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築 VRChat ver / Building-a-low-latency-distributed-KVS-for-personalized-content-delivery-VRChat-ver
bootjp
1
120
Raftとは? 仕組みから考える得意なこと苦手なこと/What is Raft? Strengths and Weaknesses Based on Its Mechanism
bootjp
7
3.9k
Spannerはなぜ原子時計が必要だったのか?/あるいはSpanner Cloneはなぜ不要にできたのか? / Why did Spanner need an atomic clock? Or Why could Spanner Clone not be needed?
bootjp
1
150
【VAアカデミア用】パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築
bootjp
0
37
Other Decks in Research
See All in Research
老舗ものづくり企業でリサーチが変革を起こすまで - 三菱重工DXの実践
skydats
0
180
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
540
LLMアプリケーションの透明性について
fufufukakaka
0
230
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
990
さくらインターネット研究所テックトーク2026春、研究開発Gr.25年度成果26年度方針
kikuzo
0
140
LLM の Attention 機構まとめ — 数式・計算量・メモリ
puwaer
7
2.1k
羽田新ルート運用6年の検証
1manken
0
160
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
mssmkmr
0
510
オーストリア流 都市の公共交通サービス水準評価@公共交通オープンデータ最前線2026
trafficbrain
0
180
2026年3月1日(日)福島「除染土」の公共利用をかんがえる
atsukomasano2026
0
620
AIエージェント時代のLLM-jpモデルのあるべき姿
k141303
0
450
SAKURAONE:An Open Ethernet-based AI HPC System And Its Observed Workload Dynamicsin a Single-Tenant LLM Development Environment
yuukit
1
310
Featured
See All Featured
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
160
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
210
Abbi's Birthday
coloredviolet
2
8k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
How to build a perfect <img>
jonoalderson
1
5.6k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
KATA
mclloyd
PRO
35
15k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
Deep Space Network (abreviated)
tonyrice
0
170
Transcript
Akamaiのキャッシュ効率を支え るAdaptSizeについての論文を読 んでみた 第19回 分散システム集会 on VRChat @bootjp / ぶーと
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
自己紹介 HN: ぶーと 分散システム集会の運営の一人。 RaftやKVS、TiKVが好きです。 仕事では、マイクロサービス/マルチプロダク トに向けた分散基盤の設計や実装をしていま す。 前の仕事ではRaftベースの分散ストレージを 作っていました。
@bootjp
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減される
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム ◦
キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信や静的データの配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュ しデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム
◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信 や静的データ の配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦ CDN は メモリ→ ディスク → オリジンの多段キャッシュで配信効率を最大化している
▪ 今回はメモリを焦点にあてたキャッシュヒット率の向上のはなし ◦ 限られたメモリでのキャッシュヒット率の最適化には2つの要素がある ▪ admission: オブジェクトをキャッシュに入れるかどうかの判断 ▪ eviction: 新たなオブジェクトを追加する際、どのオブジェクトを追い出すかの判断
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 100か国以上の1500を超えるネットワークに170,000台以上のサーバーがある ◦ 様々なサイズを配信する数千のプロバイダーから構成される ◦ リクエストパターンは時間によって大きく異なる ▪
日中時間帯はWebサイトのりように偏る ▪ 夜間はWebサイトに加え大容量なメディアファイルに偏る
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ すべてのオブジェクトがラウンドロビンで均等にアクセスされる環境があるとする ◦ メモリ容量が1GBの時にサイズが100 KBの小さなオブジェクトが10,000個あるとする ◦ 500MBのファイルが新たにリクエストされてキャッシュにAdmissionされる
▪ => 5000オブジェクトがEvictionしキャッシュヒット率が50%を下回る
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 何をEvictionするかではなく、なにをAdmissionするかが大事 ▪ これがAdaptSize(この論文)の前提となっている知識
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) •
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) • よくわかり ませんでし た。。 続きは議論 で...
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価手法 • トレースベースシミュレーション+プロトタイプ実装ベンチ ◦ Varnish・Nginx • Akamaiプロダクショントレース ◦ HK: 4.5億
req / 157.5 TiB / 2,500万 objects ◦ US: 4.4億 req / 152.3 TiB / 5,500万 objects • メモリ1.2 GiB、C++シミュレータで各方式のOHRを比較 • 比較対象: Nginx / Varnish / 研究系8手法 / 将来知識ありの SIZE-OPT
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ vs Varnish: +47~91% / vs Nginx:
+30~48% ◦ SIZE-OPT の95~99% をオンラインで達成
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ 他の研究手法と比べても高いキャッシュヒット率の維持
評価結果 • 堅牢性 ◦ キャッシュヒット率を維持 ▪ 事前知識を持つSIZE-OPTと比較 • スパイクリクエスト: 95%
• 敵対的ミックス: 81% ◦ Randomized: 短期間に大量のトラフィックが急増するようなケース ◦ Adversarial: 性質の異なるアクセスを繰り返す(Web⇔動画)
評価結果 • 副作用なし/好影響 ◦ DCバイトヒット率は維持、ディスク利用率 −20% / IOPS −10% ◦
E2Eレイテンシ短縮(中央値 −43%, 高分位でも −30%超)
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
まとめと議論 • CDNでは時間帯によってリクエストパターンが異なる • その中でメモリ上のキャッシュヒット率を向上させる必要がある • 異なるオブジェクトを対象としたキャッシュヒット率ではadmissonが大事 ◦ 限られたメモリに大きなファイルを入れるとそれだけでキャッシュヒット率が落ちるため ◦
十分アクセスされる大きなファイルだけを入れる必要がある • 既存の研究ではevictionに焦点を当てたものが多い • AdaptSizeではadmissiionに焦点を当てた • 事前知識がある SIZE-OPTと数ポイントしか性能劣化しない手法を考案した ◦ これが AdaptSize • Varnish統合ができ、非常に使い勝手が良い
議論 • bootjpはマルコフ連鎖の式がよくわからなかったので、詳しい人がいたらぜひ議論をし たいです。 •