Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
bootjp / ぶーと
November 03, 2025
Research
640
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp / ぶーと
November 03, 2025
More Decks by bootjp / ぶーと
See All by bootjp / ぶーと
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.7k
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
690
パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築 VRChat ver / Building-a-low-latency-distributed-KVS-for-personalized-content-delivery-VRChat-ver
bootjp
1
120
Raftとは? 仕組みから考える得意なこと苦手なこと/What is Raft? Strengths and Weaknesses Based on Its Mechanism
bootjp
7
3.9k
Spannerはなぜ原子時計が必要だったのか?/あるいはSpanner Cloneはなぜ不要にできたのか? / Why did Spanner need an atomic clock? Or Why could Spanner Clone not be needed?
bootjp
1
150
【VAアカデミア用】パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築
bootjp
0
37
Other Decks in Research
See All in Research
NLP colloquium: AI Safety Survey
kanekomasahiro
0
550
typst の使い方:言語学を研究する学生のために
gitomochang
0
450
Anthropic が提案する LLM の内部状態を自然言語で説明可能にした Natural Language Autoencoders / Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations
shunk031
0
120
人間中心の意思決定支援AI
yukinobaba
PRO
4
2.5k
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
250
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
400
Φ-Sat-2のAutoEncoderによる情報圧縮系論文
satai
4
760
存立危機事態の再検討
jimboken
0
290
[BlackHatAsia2026] Hidden Telemetry: Uncovering TraceLogging ETW Providers You're Not Using (Yet)
asuna_jp
1
510
AIを叩き台として、 「検証」から「共創」へと進化するリサーチ
mela_dayo
0
280
LINEヤフー データサイエンス Meetup「三井物産コモディティ予測チャレンジ」の舞台裏-AlpacaTechパート
gamella
1
560
YOLO26_ Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection
satai
3
790
Featured
See All Featured
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
230
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
250
Agile that works and the tools we love
rasmusluckow
331
21k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
610
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
How to Talk to Developers About Accessibility
jct
2
220
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Technical Leadership for Architectural Decision Making
baasie
3
400
Information Architects: The Missing Link in Design Systems
soysaucechin
0
960
Transcript
Akamaiのキャッシュ効率を支え るAdaptSizeについての論文を読 んでみた 第19回 分散システム集会 on VRChat @bootjp / ぶーと
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
自己紹介 HN: ぶーと 分散システム集会の運営の一人。 RaftやKVS、TiKVが好きです。 仕事では、マイクロサービス/マルチプロダク トに向けた分散基盤の設計や実装をしていま す。 前の仕事ではRaftベースの分散ストレージを 作っていました。
@bootjp
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減される
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム ◦
キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信や静的データの配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュ しデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム
◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信 や静的データ の配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦ CDN は メモリ→ ディスク → オリジンの多段キャッシュで配信効率を最大化している
▪ 今回はメモリを焦点にあてたキャッシュヒット率の向上のはなし ◦ 限られたメモリでのキャッシュヒット率の最適化には2つの要素がある ▪ admission: オブジェクトをキャッシュに入れるかどうかの判断 ▪ eviction: 新たなオブジェクトを追加する際、どのオブジェクトを追い出すかの判断
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 100か国以上の1500を超えるネットワークに170,000台以上のサーバーがある ◦ 様々なサイズを配信する数千のプロバイダーから構成される ◦ リクエストパターンは時間によって大きく異なる ▪
日中時間帯はWebサイトのりように偏る ▪ 夜間はWebサイトに加え大容量なメディアファイルに偏る
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ すべてのオブジェクトがラウンドロビンで均等にアクセスされる環境があるとする ◦ メモリ容量が1GBの時にサイズが100 KBの小さなオブジェクトが10,000個あるとする ◦ 500MBのファイルが新たにリクエストされてキャッシュにAdmissionされる
▪ => 5000オブジェクトがEvictionしキャッシュヒット率が50%を下回る
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 何をEvictionするかではなく、なにをAdmissionするかが大事 ▪ これがAdaptSize(この論文)の前提となっている知識
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) •
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) • よくわかり ませんでし た。。 続きは議論 で...
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価手法 • トレースベースシミュレーション+プロトタイプ実装ベンチ ◦ Varnish・Nginx • Akamaiプロダクショントレース ◦ HK: 4.5億
req / 157.5 TiB / 2,500万 objects ◦ US: 4.4億 req / 152.3 TiB / 5,500万 objects • メモリ1.2 GiB、C++シミュレータで各方式のOHRを比較 • 比較対象: Nginx / Varnish / 研究系8手法 / 将来知識ありの SIZE-OPT
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ vs Varnish: +47~91% / vs Nginx:
+30~48% ◦ SIZE-OPT の95~99% をオンラインで達成
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ 他の研究手法と比べても高いキャッシュヒット率の維持
評価結果 • 堅牢性 ◦ キャッシュヒット率を維持 ▪ 事前知識を持つSIZE-OPTと比較 • スパイクリクエスト: 95%
• 敵対的ミックス: 81% ◦ Randomized: 短期間に大量のトラフィックが急増するようなケース ◦ Adversarial: 性質の異なるアクセスを繰り返す(Web⇔動画)
評価結果 • 副作用なし/好影響 ◦ DCバイトヒット率は維持、ディスク利用率 −20% / IOPS −10% ◦
E2Eレイテンシ短縮(中央値 −43%, 高分位でも −30%超)
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
まとめと議論 • CDNでは時間帯によってリクエストパターンが異なる • その中でメモリ上のキャッシュヒット率を向上させる必要がある • 異なるオブジェクトを対象としたキャッシュヒット率ではadmissonが大事 ◦ 限られたメモリに大きなファイルを入れるとそれだけでキャッシュヒット率が落ちるため ◦
十分アクセスされる大きなファイルだけを入れる必要がある • 既存の研究ではevictionに焦点を当てたものが多い • AdaptSizeではadmissiionに焦点を当てた • 事前知識がある SIZE-OPTと数ポイントしか性能劣化しない手法を考案した ◦ これが AdaptSize • Varnish統合ができ、非常に使い勝手が良い
議論 • bootjpはマルコフ連鎖の式がよくわからなかったので、詳しい人がいたらぜひ議論をし たいです。 •