Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
K8sGPTでクラスタのAI分析やってみた
Search
Ryotaro Matsui
November 09, 2023
Technology
1
430
K8sGPTでクラスタのAI分析やってみた
Kubernetes Novice Tokyo #28 LT2の登壇資料です。
Ryotaro Matsui
November 09, 2023
Tweet
Share
Other Decks in Technology
See All in Technology
モブプログラミング再入門 ー 基本から見直す、AI時代のチーム開発の選択肢 ー / A Re-introduction of Mob Programming
takaking22
1
250
「ヒットする」+「近い」を同時にかなえるスマートサジェストの作り方.pdf
nakasho
0
140
メタデータ同期に潜んでいた問題 〜 Cache Stampede 時の Cycle Wait を⾒つけた話
lycorptech_jp
PRO
0
150
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1.1k
自動テストが巻き起こした開発プロセス・チームの変化 / Impact of Automated Testing on Development Cycles and Team Dynamics
codmoninc
2
1.2k
Abuse report だけじゃない。AWS から緊急連絡が来る状況とは?昨今の攻撃や被害の事例の紹介と備えておきたい考え方について
kazzpapa3
1
120
GitLab Duo Agent Platform + Local LLMサービングで幸せになりたい
jyoshise
0
170
Claude Codeが爆速進化してプラグイン追従がつらいので半自動化した話 ver.2
rfdnxbro
0
400
類似画像検索モデルの開発ノウハウ
lycorptech_jp
PRO
4
990
8万デプロイ
iwamot
PRO
2
160
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
ビズリーチにおける検索・推薦の取り組み / DEIM2026
visional_engineering_and_design
1
110
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
28
2.5k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
150
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
470
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.7k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
760
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
140
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
140
Speed Design
sergeychernyshev
33
1.6k
The agentic SEO stack - context over prompts
schlessera
0
680
Transcript
K8sGPTでクラスタのAI分析やってみた Kubernetes Novice Tokyo #28 Matsui @blaaackard
自己紹介 • 名前:松井 僚太郎 (社会人3年目) • 会社:某SIer • 業務:非機能改善/インフラのメンテナンス等 •
技術:GoogleCloud ,Kubernetes(GKE) • 趣味:ウイスキー、サウナ、旅行、阪神 etc.
登壇の経緯 • 外部登壇してみたいという想い • 逆井さんの煽り後押しを受けて
本日お話する内容 • K8sGPTとは • K8sGPT使って実際にクラスタの分析してみた • 使ってみた感想
K8sGPTとは • Kubernetes クラスタ内の問題を探索し、評価、解説するためのツール • SREの専門知識が組み込まれている • 実行自体はシンプルで`k8sgpt analyze`というコマンドを叩くだけ •
k8sgpt-operatorをクラスタにデプロイすることもできる(自動で分析可能) ※Canvaの画像生成AIで作成したイラスト
K8sGPTとは • CNDF2023でスリーシェイクのnwiizo さんが詳細に説明している • AIOpsについての説明もあり、とても 分かりやすいです https://event.cloudnativedays.jp/cndf2023/talks/1885
積極的なリリース https://github.com/k8sgpt-ai/k8sgpt
利用可能なAnalyzers 下記コマンドで使用可能 ❯ k8sgpt filters add HorizontalPodAutoScaler ❯ k8sgpt filters
add PodDisruptionBudget ❯ k8sgpt filters add NetworkPolicy
実際に使ってみる 1. ChatGPTに問題を含んだマニフェストファイルを作成してもらう 2. 上記ファイルをクラスタに適用する 3. K8sGPTで分析する 4. 分析結果からマニフェストファイルを修正する 5.
再度K8sGPTで分析する
実際に使ってみる プロンプトエンジニアリング 頑張りたい…
実際に使ってみる • Namespaceで絞り込み • Solution表示 • 日本語化
実際に使ってみる • 問題を修正して適用 • 再度K8sGPTで分析
実際に使ってみる • PersistentVolumeClaim • 存在しないStrageClassを指定 • Deployment • ノードのリソースが不足するようにlimits/requestsを指定
複雑な問題はどうか • 業務で実際にあった問い合わせ あるpodがPending状態で起動してないペン… Describeで見るとスケジューリングが問題ぽいけど原因が分からないペン… そのリソースはStatefulSetとして定義されているペン 紐づくPersistentVolumeと同じゾーンで起動しているノードに乗せてあげる 必要があるんだけど、対象ノードのリソースが全て埋まっているペン… 対象ノードのpodを一旦他ノードに移して対処するペン
複雑な問題はどうか • 検証クラスタで事象を再現 • K8sGPTで分析 Podのスケジュールは提案してくれている 初心者目線だとStatefulsetとPersistentVolumeのZoneについて 触れてくれた方が親切だな…
使ってみた感想 • 単純な問題についての解析は容易にできる • 問題があるリソースの洗い出しに便利 • わざわざdescribeする必要がない • k8sgpt-operatorを導入して継続的なリソース監視は有効そう •
Prometheus や Alertmanager などとの統合も可能 • 商用環境で使うのはハードル高そう • AI Providerに対する信頼 • 今後の機能追加や性能向上に期待!
ご清聴ありがとうございました