Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EKS on Fargateは最高のJob基盤 / jawsug_bgnr
Search
h3poteto
February 13, 2020
Programming
1.1k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
EKS on Fargateは最高のJob基盤 / jawsug_bgnr
JAWS-UG 初心者支部#23 次回のハンズオン勉強会向けのチューター向け予習会 でのLT
h3poteto
February 13, 2020
More Decks by h3poteto
See All by h3poteto
Kubernetes上で単発のジョブを実行するkube-jobというツールを作った / kubernetesmeetuptokyo22
h3poteto
6
8.9k
Electronによるアプリケーション開発事情2018 / builderscon2018
h3poteto
9
11k
fluentdサーバをchefで構築するの辛かったけどDockerも別に救世主じゃなかった / tokyu ruby kaigi 12
h3poteto
0
5.1k
ECSのサービスをslack botでデプロイする // ecs-goploy
h3poteto
1
5.9k
まだRailsで消耗してるの?
h3poteto
7
4.9k
阿澄佳奈と昇竜拳
h3poteto
1
570
Other Decks in Programming
See All in Programming
決定論的オーケストレーションの設計と実装 / Design and Implementation of Deterministic Orchestration
nrslib
4
1.4k
「エンジニアインターン、どうやって取った?」準備のリアルを語るLT会 Progate BAR
akiomatic
0
140
Mujeres en SEO Summit 2026 - Greatest Disaster Hits en Web Performance
guaca
0
190
エージェンティックRAGにAWSで入門しよう!
har1101
8
1.7k
脅威をエンジニアリングの糧にして――現場編 / Turning Threats into Engineering Fuel — Field Edition
nrslib
0
290
LLMによるContent Moderationの本番運用の裏側と品質担保への挑戦
suikabar
3
710
ユニットテストの先へ:テスト技法で要求・仕様を整理するJava開発実践 / Beyond_Unit_Testing_Practical_Java_Development_Techniques_for_Organizing_Requirements_and_Specifications
shimashima35
0
410
LLM本来の能力を解き放つサンドボックス技術とAI民主化への適用
yukukotani
3
4.3k
Lessons from Spec-Driven Development
simas
PRO
0
210
フロントエンドとバックエンドで「1文字」を揃えよう
youkidearitai
PRO
0
710
技術的負債解消で開発者の未来を開く- AIの力でコード刷新
kmd2kmd
0
110
PHPで使える日時の表現と、その知り方 #frontend_phpcon_do
o0h
PRO
0
260
Featured
See All Featured
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
AI: The stuff that nobody shows you
jnunemaker
PRO
8
720
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
440
Embracing the Ebb and Flow
colly
88
5.1k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
430
Leo the Paperboy
mayatellez
7
1.8k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
170
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
460
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.5k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Transcript
EKS on Fargate は最⾼のJob 基盤 @h3poteto
⾃⼰紹介 Akira Fukushima ( 福島 明) GitHub: h3poteto twitter: @h3_poteto
仕事: SRE / LAPRAS Inc.
Fargate 使ってますか?
Fargate ってなに インスタンスの管理をすることなくDocker コンテナを動かせるエン ジン もともとECS Fargate として,ECS のノードをフルマネージドして くれていた
最近EKS on Fargate が出たことで,Kubernetes からも利⽤できるよ うになった
ノードがフルマネージドってどういう こと? AWS 側で管理されているFargate ⽤のインスタンスが存在する (我々からは⾒えない Fargate の要求があると,このインスタンスをユーザに割り当て て,そのPod 専⽤のインスタンスとして供給する
Pod が終了したらインスタンスもクラスタから除外される 我々のVPC 内に存在するEC2 とは別管理なので,EC2 ⼀覧にも出て こない もちろんインスタンスにSSH するこもとできない
None
ただしあくまでECS/EKS のノードの⼀ 部であることは変わらない
(追加設定はいるけど)普通に ECS/EKS のコンテナと同じように動く
みんなサーバーレスだって盛り上がる けど AutoScale が楽だってWeb サーバを乗 せたがるけど
むしろJob を実⾏するのに最適
Job Kubernetes のJob とかCronJob 単発実⾏で集計処理とかをやりたい 多重実⾏はやめてほしい
Web サーバとの違い ⼤抵のWeb サーバは複数台起動している リクエストはLoadBalancer で振り分けている つまり,1 台くらい落ちてもどうということはない 落ちても,⾃動復旧してくれれば問題ない Job
は,落ちたら再実⾏すれば良い?
再実⾏/ 多重実⾏可能なJob は,かなり 気を使って作る必要がある
単発実⾏したJob が 落ちない基盤であ ってほしい
通常ノードの場合 AutoScalingGroup は,ScaleOut するが当然ScaleIn も発⽣する ClusterAutoscaler はScaleIn 前にDrain を実⾏してくれるが,それは つまりJob
の再実⾏ということになる SpotInstance を使っていれば,ノードはある⽇突然死ぬ
Fargate は全ての要求を満たすのでは?
Fargate Pod が死ぬまでインスタンスは死なない そもそもAutoScalingGroup ではないのでScaleIn の対象外 他のPod が配置されることがないので,Job が終わったらすぐにノー ドを殺しても問題ない
最⾼では?
None
これを待っていた!ありがとうAWS
EKS on Fargate のつらみ
Job がComplete してもPod が残る限り ノードも残る
Fargate ノードのライフサイクル Pod がリクエストされた時点で確保 他のPod はスケジュールされない Pod がDelete されるまで残り続ける
Pod 内のコマンドが正常終了してもPod ⾃⾝が削除されるわけではない Pod はCompleted として残る
つまりCompleted したものも課⾦対象
TTL Controller k8s 上で完了したJob をクリーンアップしてくれるController ttlSecondsAfterFinished で指定された秒数後にPod を削除する まだAlpha の機能のためEKS
では使えない EKS でもFeatureGates をカスタマイズできるようにし てほしい……
Pod のENI に付与されるSG の指定がで きない
Farget のSecurityGroup EKS on Fargate のPod にはENI が付与される そこにSG が付与されることで,アクセス制限ができる
しかし付与されるSG は,EKS クラスタ本体のSG 任意のSG を指定することができないので,細かいアクセス制限がや りにくい EKS クラスタ本体のSG ⾃体もこちらで指定することができないの で,terraform で管理しにくい
DaemonSet が使えない これはどうにもならないかも……
DaemonSet が使えない EKS on Fargate ではFargate で起動したPod しかFargate ノードに配 置されない
Kubernetes のDaemonSet が配置できない Fluentd でコンテナのログを全部かき集めたり Datadog でインスタンスやコンテナのメトリクスを収集したりでき ない
VolumeMount が使えない せめてEFS は使いたいな……
VolumeMount が使えない EC2 インスタンスではないので当然EBS はAttach できない hostPath も使えない ので当然EFS も使えない
emptyDir だけは使えるが…… EFS だけはRoadmap にリクエストが上がっている: https://github.com/aws/containers-roadmap/issues/53
対応してもらえるのを楽しみにしてる