AI前提のサービス運用ってなんだろう?
by
ryuichi1208
×
Copy
Open
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Slide 1
Slide 1 text
AI前提のサービス運⽤ってなんだろう? 渡部⿓⼀ JAWS-UG SRE⽀部 #10 SREでもAI活⽤がしたい!
Slide 2
Slide 2 text
⾃⼰紹介 ● 株式会社IVRy SWE ○ 2024/11/1 ⼊社 ● 渡部⿓⼀ ● 仙台在住 ● EOL対応‧障害対応
Slide 3
Slide 3 text
サービスの運⽤⼤変じゃないですか?
Slide 4
Slide 4 text
課題 ● システムは複雑化していき運⽤コストは増えていきがち ● WebサーバとDBだけがあるというようなシンプルな構成と同様の運⽤をしていく のは難しい ○ 技術要素、クラウド、プラットフォームエンジニアリング、SRE ● 何が⼤変なのかわからないくらい⼤変になったり
Slide 5
Slide 5 text
どうするとよいのかの考察 ● ベテランエンジニアを囲って置く ○ IT業界は特に流動性が⾼いと⾔われている中で現実的ではない ● たくさんエンジニアを採⽤して育てる ○ プロダクトの成⻑速度に対して間に合う場合を除いて現実的ではない ● 今いる⼈が全⼒で頑張る ○ 複雑なシステムを完全に理解する努⼒をしてそのメンバーだけで運⽤ ○ 組織改編、異動⼀つで変わる
Slide 6
Slide 6 text
どうするとよいのかの考察 ● チームメンバーに依存した運⽤のやり⽅でどうにかするのは難しそう ● チームの⼊れ替わりを前提とした運⽤が必要となる ○ チームレジリエンス
Slide 7
Slide 7 text
⼈の⼊れ替わりが発⽣しても強いチームを作る ● ⼊れ替わりに強いチーム ○ オンボーディングの仕組みが整っている ○ 属⼈化、暗黙知が少ない ○ オブザーバビリティが⾼いシステム ○ ドキュメントがある
Slide 8
Slide 8 text
ドキュメントの運⽤は難しい ● ドキュメントがあることでチームレジリエンスが⾼まりそう ● ⼀⽅でドキュメント⾃体の運⽤は難しい ○ サービス運⽤のためのドキュメントとなるとシステムの複雑化に対して、 ド キュメント数が多くなる ○ その多いドキュメントを更新するのも検索するのも⼤変
Slide 9
Slide 9 text
いい感じに更新していい感じに検索をしたい
Slide 10
Slide 10 text
いい感じに検索したい ● キーワード検索だけだと⾟い ● GitHubやNotionに情報散らばっていたりもする ● ⽣成AIを使っていい感じにする ○ ChatGPTそのままだとできない ○ プロンプトエンジニアリング、ファインチューニング、RAG
Slide 11
Slide 11 text
いい感じに検索したい ● RAG (Retrieval Augmented Generation) ○ ⼤規模⾔語モデル(LLM)によるテキスト⽣成に外部情報の検索を組み合わ せることで、回答精度を向上させる技術
Slide 12
Slide 12 text
RAG実装⽅法 ● ⾃前実装 ○ 特定のユースケースに合わせて検索や⽣成ロジックを柔軟に調整可能 ● ノーコード(Dify) ○ ⼿軽にAIアプリを作れるOSSのLLMアプリ開発プラットフォーム ○ コードを書く量が少なく、簡単な設定で利⽤可能 ○ クラウドサービスもある ■ ローカルで動かしてます
Slide 13
Slide 13 text
ざっくり構成
Slide 14
Slide 14 text
RAGで検索性はよくなるのか? ● 集約してベクトル検索にするだけでキーワード検索よりだいぶマシ ● チャット形式で欲しい情報までアクセスできるのは体験として良い
Slide 15
Slide 15 text
いい感じに更新されたい ● ドキュメント⾃体が古い場合でもその情報を元に回答が⽣成されてしまう ● いい感じに鮮度が保たれたドキュメントを維持したい ● が、うまくいく⽅法は思いついてないです ● 今後変わらない情報以外は古すぎるドキュメントを検索対象から外す? ● RAGとか⾔ってる場合じゃなくドキュメントを更新するようにすべきなので は?みたいに⽴ち戻ったり
Slide 16
Slide 16 text
その他
Slide 17
Slide 17 text
ハルシネーション対策 ● ハルシネーション ○ AIが事実にもとづかない情報や、実際には存在しない情報を⽣成する現象 ● とりあえずBotに情報元を吐かせてそれを⼈が判断してるだけ ○ 特別なハルシネーション対策はしてない ● AIOpsで⾃動化までやれると良いが結局は⼈の判断が最終的には必須であるので そこまで今は頑張らなくても良いかなと
Slide 18
Slide 18 text
Graph RAGとかも便利そう ● Microsoft ResearchがRAGの新たなアプローチ、グラフ理論を応⽤したRAG ● RAGに知識グラフを導⼊すると精度が3倍も上がるという調査結果 ○ ⽂章内でキーワード同⼠の関連をグラフ構造として保持して、そのデータを もとにRAGをする ● LLMが⽣成した知識グラフを使⽤してプロンプトを拡張し、検索、⽣成を⾏う ○ 例 ⼀つの障害でも複数の事象が絡み合う運⽤で相性が良さそう
Slide 19
Slide 19 text
No content
Slide 20
Slide 20 text
感想とまとめ
Slide 21
Slide 21 text
感想とまとめ ● Notionでドキュメント書いてDifyでお試しで動かしているが使えている ● オペレーションへの疑問をChat形式で回答をもらえる&ソースを持ってきてくれ るので便利 ● ⾼いオブザーバビリティにシニアな運⽤エンジニアがいれば未知の事象に対して もAIの助けがいらない気もする