Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
K8sGPTでクラスタのAI分析やってみた
Search
Ryotaro Matsui
November 09, 2023
Technology
1
410
K8sGPTでクラスタのAI分析やってみた
Kubernetes Novice Tokyo #28 LT2の登壇資料です。
Ryotaro Matsui
November 09, 2023
Tweet
Share
Other Decks in Technology
See All in Technology
Uniadex__公開版_20250617-AIxIoTビジネス共創ラボ_ツナガルチカラ_.pdf
iotcomjpadmin
0
150
Snowflake Summit 2025 データエンジニアリング関連新機能紹介 / Snowflake Summit 2025 What's New about Data Engineering
tiltmax3
0
250
白金鉱業Meetup_Vol.19_PoCはデモで語れ!顧客の本音とインサイトを引き出すソリューション構築
brainpadpr
2
490
初めてのAzure FunctionsをClaude Codeで作ってみた / My first Azure Functions using Claude Code
hideakiaoyagi
1
190
CSS、JSをHTMLテンプレートにまとめるフロントエンド戦略
d120145
0
240
Welcome to the LLM Club
koic
0
140
2025/6/21 日本学術会議公開シンポジウム発表資料
keisuke198619
2
480
BigQuery Remote FunctionでLooker Studioをインタラクティブ化
cuebic9bic
2
230
Amplifyとゼロからはじめた AIコーディング 成果と展望
mkdev10
1
370
~宇宙最速~2025年AWS Summit レポート
satodesu
1
1.4k
2年でここまで成長!AWSで育てたAI Slack botの軌跡
iwamot
PRO
2
460
本当に使える?AutoUpgrade の新機能を実践検証してみた
oracle4engineer
PRO
1
130
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.8k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
200
BBQ
matthewcrist
89
9.7k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.8k
4 Signs Your Business is Dying
shpigford
184
22k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
Testing 201, or: Great Expectations
jmmastey
42
7.5k
RailsConf 2023
tenderlove
30
1.1k
Transcript
K8sGPTでクラスタのAI分析やってみた Kubernetes Novice Tokyo #28 Matsui @blaaackard
自己紹介 • 名前:松井 僚太郎 (社会人3年目) • 会社:某SIer • 業務:非機能改善/インフラのメンテナンス等 •
技術:GoogleCloud ,Kubernetes(GKE) • 趣味:ウイスキー、サウナ、旅行、阪神 etc.
登壇の経緯 • 外部登壇してみたいという想い • 逆井さんの煽り後押しを受けて
本日お話する内容 • K8sGPTとは • K8sGPT使って実際にクラスタの分析してみた • 使ってみた感想
K8sGPTとは • Kubernetes クラスタ内の問題を探索し、評価、解説するためのツール • SREの専門知識が組み込まれている • 実行自体はシンプルで`k8sgpt analyze`というコマンドを叩くだけ •
k8sgpt-operatorをクラスタにデプロイすることもできる(自動で分析可能) ※Canvaの画像生成AIで作成したイラスト
K8sGPTとは • CNDF2023でスリーシェイクのnwiizo さんが詳細に説明している • AIOpsについての説明もあり、とても 分かりやすいです https://event.cloudnativedays.jp/cndf2023/talks/1885
積極的なリリース https://github.com/k8sgpt-ai/k8sgpt
利用可能なAnalyzers 下記コマンドで使用可能 ❯ k8sgpt filters add HorizontalPodAutoScaler ❯ k8sgpt filters
add PodDisruptionBudget ❯ k8sgpt filters add NetworkPolicy
実際に使ってみる 1. ChatGPTに問題を含んだマニフェストファイルを作成してもらう 2. 上記ファイルをクラスタに適用する 3. K8sGPTで分析する 4. 分析結果からマニフェストファイルを修正する 5.
再度K8sGPTで分析する
実際に使ってみる プロンプトエンジニアリング 頑張りたい…
実際に使ってみる • Namespaceで絞り込み • Solution表示 • 日本語化
実際に使ってみる • 問題を修正して適用 • 再度K8sGPTで分析
実際に使ってみる • PersistentVolumeClaim • 存在しないStrageClassを指定 • Deployment • ノードのリソースが不足するようにlimits/requestsを指定
複雑な問題はどうか • 業務で実際にあった問い合わせ あるpodがPending状態で起動してないペン… Describeで見るとスケジューリングが問題ぽいけど原因が分からないペン… そのリソースはStatefulSetとして定義されているペン 紐づくPersistentVolumeと同じゾーンで起動しているノードに乗せてあげる 必要があるんだけど、対象ノードのリソースが全て埋まっているペン… 対象ノードのpodを一旦他ノードに移して対処するペン
複雑な問題はどうか • 検証クラスタで事象を再現 • K8sGPTで分析 Podのスケジュールは提案してくれている 初心者目線だとStatefulsetとPersistentVolumeのZoneについて 触れてくれた方が親切だな…
使ってみた感想 • 単純な問題についての解析は容易にできる • 問題があるリソースの洗い出しに便利 • わざわざdescribeする必要がない • k8sgpt-operatorを導入して継続的なリソース監視は有効そう •
Prometheus や Alertmanager などとの統合も可能 • 商用環境で使うのはハードル高そう • AI Providerに対する信頼 • 今後の機能追加や性能向上に期待!
ご清聴ありがとうございました