Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
K8sGPTでクラスタのAI分析やってみた
Search
Ryotaro Matsui
November 09, 2023
Technology
1
260
K8sGPTでクラスタのAI分析やってみた
Kubernetes Novice Tokyo #28 LT2の登壇資料です。
Ryotaro Matsui
November 09, 2023
Tweet
Share
Other Decks in Technology
See All in Technology
GrafanaMeetup_AmazonManagedGrafanaのアクセス制御機能とマルチテナント環境下でのアクセス制御について
daitak
0
410
Microsoft Intune 勉強会 第 2 回目
tamaiyutaro
2
460
TechFeed Experts Night#27 〜 フロントエンドフレームワーク最前線 (Svelte)
baseballyama
2
600
地理空間データ可視化・解析・活用ソリューション Pacific Spatial Solutions (PSS)
pacificspatialsolutions
0
340
アクセス制御にまつわる改善 / Improving access control
itkq
0
590
M5stackで使用できるpHセンサの開発
shinrinakamura
0
210
成長をサポートするピープルマネジメントのやり方
sioncojp
9
1.2k
Cracking the KubeCon CfP
inductor
2
270
社内アプリで Cloudflare D1を プロダクト運用してみた体験談(Tokyo)
haochenx
0
120
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
isaoshimizu
1
1.1k
【基本】データベース設計
oracle4engineer
PRO
2
200
VSCodeの拡張機能を作っている話
ebarakazuhiro
1
810
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
125
8.5k
Unsuck your backbone
ammeep
663
57k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
21
1.6k
Web development in the modern age
philhawksworth
203
10k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
26
2.3k
Infographics Made Easy
chrislema
238
18k
No one is an island. Learnings from fostering a developers community.
thoeni
16
2.1k
Scaling GitHub
holman
457
140k
Code Review Best Practice
trishagee
56
15k
Happy Clients
brianwarren
92
6.4k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
14
1.5k
StorybookのUI Testing Handbookを読んだ
zakiyama
13
4.6k
Transcript
K8sGPTでクラスタのAI分析やってみた Kubernetes Novice Tokyo #28 Matsui @blaaackard
自己紹介 • 名前:松井 僚太郎 (社会人3年目) • 会社:某SIer • 業務:非機能改善/インフラのメンテナンス等 •
技術:GoogleCloud ,Kubernetes(GKE) • 趣味:ウイスキー、サウナ、旅行、阪神 etc.
登壇の経緯 • 外部登壇してみたいという想い • 逆井さんの煽り後押しを受けて
本日お話する内容 • K8sGPTとは • K8sGPT使って実際にクラスタの分析してみた • 使ってみた感想
K8sGPTとは • Kubernetes クラスタ内の問題を探索し、評価、解説するためのツール • SREの専門知識が組み込まれている • 実行自体はシンプルで`k8sgpt analyze`というコマンドを叩くだけ •
k8sgpt-operatorをクラスタにデプロイすることもできる(自動で分析可能) ※Canvaの画像生成AIで作成したイラスト
K8sGPTとは • CNDF2023でスリーシェイクのnwiizo さんが詳細に説明している • AIOpsについての説明もあり、とても 分かりやすいです https://event.cloudnativedays.jp/cndf2023/talks/1885
積極的なリリース https://github.com/k8sgpt-ai/k8sgpt
利用可能なAnalyzers 下記コマンドで使用可能 ❯ k8sgpt filters add HorizontalPodAutoScaler ❯ k8sgpt filters
add PodDisruptionBudget ❯ k8sgpt filters add NetworkPolicy
実際に使ってみる 1. ChatGPTに問題を含んだマニフェストファイルを作成してもらう 2. 上記ファイルをクラスタに適用する 3. K8sGPTで分析する 4. 分析結果からマニフェストファイルを修正する 5.
再度K8sGPTで分析する
実際に使ってみる プロンプトエンジニアリング 頑張りたい…
実際に使ってみる • Namespaceで絞り込み • Solution表示 • 日本語化
実際に使ってみる • 問題を修正して適用 • 再度K8sGPTで分析
実際に使ってみる • PersistentVolumeClaim • 存在しないStrageClassを指定 • Deployment • ノードのリソースが不足するようにlimits/requestsを指定
複雑な問題はどうか • 業務で実際にあった問い合わせ あるpodがPending状態で起動してないペン… Describeで見るとスケジューリングが問題ぽいけど原因が分からないペン… そのリソースはStatefulSetとして定義されているペン 紐づくPersistentVolumeと同じゾーンで起動しているノードに乗せてあげる 必要があるんだけど、対象ノードのリソースが全て埋まっているペン… 対象ノードのpodを一旦他ノードに移して対処するペン
複雑な問題はどうか • 検証クラスタで事象を再現 • K8sGPTで分析 Podのスケジュールは提案してくれている 初心者目線だとStatefulsetとPersistentVolumeのZoneについて 触れてくれた方が親切だな…
使ってみた感想 • 単純な問題についての解析は容易にできる • 問題があるリソースの洗い出しに便利 • わざわざdescribeする必要がない • k8sgpt-operatorを導入して継続的なリソース監視は有効そう •
Prometheus や Alertmanager などとの統合も可能 • 商用環境で使うのはハードル高そう • AI Providerに対する信頼 • 今後の機能追加や性能向上に期待!
ご清聴ありがとうございました