Slide 1

Slide 1 text

AI前提のサービス運⽤ってなんだろう? 渡部⿓⼀ JAWS-UG SRE⽀部 #10 SREでもAI活⽤がしたい!

Slide 2

Slide 2 text

⾃⼰紹介 ● 株式会社IVRy SWE ○ 2024/11/1 ⼊社 ● 渡部⿓⼀ ● 仙台在住 ● EOL対応‧障害対応

Slide 3

Slide 3 text

サービスの運⽤⼤変じゃないですか?

Slide 4

Slide 4 text

課題 ● システムは複雑化していき運⽤コストは増えていきがち ● WebサーバとDBだけがあるというようなシンプルな構成と同様の運⽤をしていく のは難しい ○ 技術要素、クラウド、プラットフォームエンジニアリング、SRE ● 何が⼤変なのかわからないくらい⼤変になったり

Slide 5

Slide 5 text

どうするとよいのかの考察 ● ベテランエンジニアを囲って置く ○ IT業界は特に流動性が⾼いと⾔われている中で現実的ではない ● たくさんエンジニアを採⽤して育てる ○ プロダクトの成⻑速度に対して間に合う場合を除いて現実的ではない ● 今いる⼈が全⼒で頑張る ○ 複雑なシステムを完全に理解する努⼒をしてそのメンバーだけで運⽤ ○ 組織改編、異動⼀つで変わる

Slide 6

Slide 6 text

どうするとよいのかの考察 ● チームメンバーに依存した運⽤のやり⽅でどうにかするのは難しそう ● チームの⼊れ替わりを前提とした運⽤が必要となる ○ チームレジリエンス

Slide 7

Slide 7 text

⼈の⼊れ替わりが発⽣しても強いチームを作る ● ⼊れ替わりに強いチーム ○ オンボーディングの仕組みが整っている ○ 属⼈化、暗黙知が少ない ○ オブザーバビリティが⾼いシステム ○ ドキュメントがある

Slide 8

Slide 8 text

ドキュメントの運⽤は難しい ● ドキュメントがあることでチームレジリエンスが⾼まりそう ● ⼀⽅でドキュメント⾃体の運⽤は難しい ○ サービス運⽤のためのドキュメントとなるとシステムの複雑化に対して、 ド キュメント数が多くなる ○ その多いドキュメントを更新するのも検索するのも⼤変

Slide 9

Slide 9 text

いい感じに更新していい感じに検索をしたい

Slide 10

Slide 10 text

いい感じに検索したい ● キーワード検索だけだと⾟い ● GitHubやNotionに情報散らばっていたりもする ● ⽣成AIを使っていい感じにする ○ ChatGPTそのままだとできない ○ プロンプトエンジニアリング、ファインチューニング、RAG

Slide 11

Slide 11 text

いい感じに検索したい ● RAG (Retrieval Augmented Generation) ○ ⼤規模⾔語モデル(LLM)によるテキスト⽣成に外部情報の検索を組み合わ せることで、回答精度を向上させる技術

Slide 12

Slide 12 text

RAG実装⽅法 ● ⾃前実装 ○ 特定のユースケースに合わせて検索や⽣成ロジックを柔軟に調整可能 ● ノーコード(Dify) ○ ⼿軽にAIアプリを作れるOSSのLLMアプリ開発プラットフォーム ○ コードを書く量が少なく、簡単な設定で利⽤可能 ○ クラウドサービスもある ■ ローカルで動かしてます

Slide 13

Slide 13 text

ざっくり構成

Slide 14

Slide 14 text

RAGで検索性はよくなるのか? ● 集約してベクトル検索にするだけでキーワード検索よりだいぶマシ ● チャット形式で欲しい情報までアクセスできるのは体験として良い

Slide 15

Slide 15 text

いい感じに更新されたい ● ドキュメント⾃体が古い場合でもその情報を元に回答が⽣成されてしまう ● いい感じに鮮度が保たれたドキュメントを維持したい ● が、うまくいく⽅法は思いついてないです ● 今後変わらない情報以外は古すぎるドキュメントを検索対象から外す? ● RAGとか⾔ってる場合じゃなくドキュメントを更新するようにすべきなので は?みたいに⽴ち戻ったり

Slide 16

Slide 16 text

その他

Slide 17

Slide 17 text

ハルシネーション対策 ● ハルシネーション ○ AIが事実にもとづかない情報や、実際には存在しない情報を⽣成する現象 ● とりあえずBotに情報元を吐かせてそれを⼈が判断してるだけ ○ 特別なハルシネーション対策はしてない ● AIOpsで⾃動化までやれると良いが結局は⼈の判断が最終的には必須であるので そこまで今は頑張らなくても良いかなと

Slide 18

Slide 18 text

Graph RAGとかも便利そう ● Microsoft ResearchがRAGの新たなアプローチ、グラフ理論を応⽤したRAG ● RAGに知識グラフを導⼊すると精度が3倍も上がるという調査結果 ○ ⽂章内でキーワード同⼠の関連をグラフ構造として保持して、そのデータを もとにRAGをする ● LLMが⽣成した知識グラフを使⽤してプロンプトを拡張し、検索、⽣成を⾏う ○ 例 ⼀つの障害でも複数の事象が絡み合う運⽤で相性が良さそう

Slide 19

Slide 19 text

No content

Slide 20

Slide 20 text

感想とまとめ

Slide 21

Slide 21 text

感想とまとめ ● Notionでドキュメント書いてDifyでお試しで動かしているが使えている ● オペレーションへの疑問をChat形式で回答をもらえる&ソースを持ってきてくれ るので便利 ● ⾼いオブザーバビリティにシニアな運⽤エンジニアがいれば未知の事象に対して もAIの助けがいらない気もする

Slide 22

Slide 22 text

ご清聴ありがとうございました