導入から運用まで！サーバーワークスの生成AI社内活用事例

導入から運用まで！サーバーワークスの生成 AI社内活用事例村上博哉株式会社サーバーワークス

2 自己紹介氏名村上博哉 (むらかみひろや) 主な役割お客様のAWS運用最適化（カスタマーサクセス）の支援を担当
AWS認定資格 Machine Learning など7つ

目次 1. Amazon Bedrock のご紹介 1. Amazon Bedrock の特徴 2.
Amazon Bedrock の活用パターン（RAGのご紹介） 2. サーバーワークスの社内活用事例 1. 社内QAチャットボットの導入 2. 運用でやっていること 3. 生成AI活用のためのおすすめファーストステップ 3. まとめ

1. Amazon Bedrock のご紹介

1-1. Amazon Bedrock の特徴

6 Amazon Bedrock の特徴インフラの管理は不要利用料は使った分だけ入出力トークンに応じた課金サーバーレスなサービスなのでインフラの管理は不要複数のモデルを利用可能データプライバシーユーザーの入力や
Amazon Bedrock からの出力はAWSやモデルプロバイダ側で再利用されない閉域網からも Amazon Bedrock サービスエンドポイントにアクセス可能 API コールしたリージョン内に顧客データが保管される他のAWSサービスとの統合による親和性が高い

7 他の AWS サービスとの統合による親和性が高いすでに AWS を使っている場合、既存の監査・証跡管理をそのまま踏襲できる AWS Identity and
Access Management (IAM) による権限管理 AWS CloudTrail による証跡管理 Amazon CloudWatch によるメトリクス・ログ監視参考： Amazon Bedrock のモニタリングを考える

1-2. Amazon Bedrock のよくある活用パターン

9 RAG（検索拡張生成）ユーザーの質問に関連する情報をプロンプトに含めることで、 Amazon Bedrock が知らない情報でも回答を可能にするプロンプトエンジニアリングの手法

2.サーバーワークスの社内活用事例

2-1.社内QAチャットボットの導入

12 社内QAチャットボット「サーバーワークスアシスタント」社内のルールやナレッジに基づいて回答するチャットボット普段使っているSlackから利用会話履歴を踏まえたやりとりも可能 ↓（有給休暇の）有効期限であることを理解

13 なぜ社内QAチャットボットをやろうと思ったのか社内ポータルサイトの課題情報量が多いよく似た情報が複数ページにまたがって記載されている古い情報が上位に検索されることがある入社歴の浅いメンバーを中心に「どこに何が書いてあるか探しにくい」状況社内ルールなどの自社データとAmazon Bedrock を組み合わせた
RAGをつくろう！

14 社内QAチャットボットの構成社内情報の検索にAmazon Kendra を採用

15 社内QAチャットボットの導入効果利用実績導入から 70 日間で質問総数は 589 件（ 1 日あたり
7 ~ 8 件）部署間の問合せツールとして採用何度でも同じことを質問できる一次情報のブラッシュアップが盛んになった一次情報に書いていないことはAIも答えられない詳細: Amazon Bedrockを使った社内QAチャットボットを3か月運用して起きた変化

2-2.運用でやっていること

17 「生成AI導入したけど誰も使わない…」にならないために導入して終わりではなく RAGの評価・改善が必要

18 RAGの評価オフライン評価データセットを使った評価オンライン評価ユーザーのフィードバックを基に行う評価 Amazon Bedrock からの回答の末尾にフィードバック用のボタンを設けている
質問コンテキスト回答フランスの首都は ? 西ヨーロッパのフランスには、中世の都市、高山の村、地中海のビーチが含まれています。首都パリは、ファッションハウス、ルーブル美術館などの古典的な美術館、エッフェル塔などの記念碑で有名です。パリです

19 オフライン評価の実例① データセットの準備チャットボットの使用履歴を保存している Amazon DynamoDB から特定の期間のデータセットを抽出データセットに含まれる情報ユーザーからの質問質問に関連するコンテキスト（
Amazon Kendra が検索してきた文書） Amazon Bedrock からの回答質問コンテキスト回答フランスの首都は ? 西ヨーロッパのフランスには、中世の都市、高山の村、地中海のビーチが含まれています。首都パリは、ファッションハウス、ルーブル美術館などの古典的な美術館、エッフェル塔などの記念碑で有名です。パリです

20 オフライン評価の実例② コンテキストおよび回答の関連性を数値化 Context Relevancy Amazon Kendra が検索してきた情報がユーザーの質問に関連しているか Answer Relevancy
Amazon Bedrock が回答した内容がユーザーの質問に関連しているか RAG評価フレームワークのragasを活用参考ブログ：RAG評価フレームワークのragasを使ってみた質問コンテキスト回答フランスの首都は ? 西ヨーロッパのフランスには、中世の都市、高山の村、地中海のビーチが含まれています。首都パリは、ファッションハウス、ルーブル美術館などの古典的な美術館、エッフェル塔などの記念碑で有名です。パリです

21 オフライン評価の実例③ 過去714件の履歴を可視化 Answer Relevancyが0.5以上の割合が84%以上ユーザーの質問に関連性の高い回答ができているユーザーの質問に関連する回答ができている

22 オフライン評価の実例④ 散布図による分析右図は714件を描画したもの X軸にContext Relevancy Y軸にAnswer Relevancy ユーザーのフィードバックで色分け

23 オフライン評価の実例⑤ 分析 Context Relevancyは低いがAnswer Relevancyは高いユーザーの質問に関連する文書を上位10個検索するよう設定しているため、関連性の高くない情報も含まれる場合がある検索した10個のコンテキストのうち1個でも
ユーザーの質問に関連していれば Amazon Bedrockは正しい回答をしていることが分かる改善基本的にはAnswer Relevancyが低いものを分析チャットボットが回答できていない存在しない情報に関する質問のため検索できない → 回答できないパターンが多数一次情報のブラッシュアップへつなげる

24 オンライン評価の実例① Answer Relevancy が高いとユーザーの評価も良いことが分かる改善対象 Answer Relevancy が高いにも関わらず、ユーザーの評価が低いもの
→もっともらしく間違った回答を生成していた

25 オンライン評価の実例② 「正しい回答が返ってこない」というフィードバックを契機に一次情報を整備 Confluence から別のSaaSへ遷移しないと情報が得られないようになっていた Confluence に表形式でFAQを追加結果、正しい回答が生成されるようになり、部署間の問合せツールとして採用

2-3.生成AI活用のためのおすすめファーストステップ

27 手軽に生成AIを試せるプレイグラウンドプレイグラウンド様々なモデル、様々なパラメータ設定でモデルの推論を試すことができるテキスト生成モデルや画像生成モデルに対応

28 手軽に生成AIを試せるプレイグラウンド主な検討ポイント回答の質と料金のバランス Temperature などのパラメータ

29 手軽に生成AIを試せるプレイグラウンド主な検討ポイント回答の質と料金のバランス Temperature などのパラメータ Amazon Bedrock の回答パラメータ

30 生成内容を確認し、どのモデルを使うか検討する Compare mode で生成内容を比較できる Claude 3 Sonnet 入力トークン 1,000
あたり$0.003 出力トークン 1,000あたり$0.015 Claude 3 Opus 入力トークン 1,000 あたり$0.015 出力トークン 1,000あたり$0.075

31 手軽に生成AIを試せるプレイグラウンド主な検討ポイントどのモデルを使うか（回答の質と料金のバランス） Temperature などのパラメータパラメータ Amazon Bedrock の回答

32 生成に影響を与えるパラメータ Temperature 0~1の範囲のパラメータ（1以上を設定できるモデルもある） Amazon Bedrock が生成する内容の多様性を調整できる Temperature が高いとき、LLMの回答は多様化する Temperature
が低いとき、LLMの回答は一貫するまずはTemperature のみを調整する（参考）Top P、Top Kとは確率の低いトークンが生成されるのを防ぐために利用される Top P 生成する言葉の候補の累積確率がP%に達した時点で、以降の候補は切り捨てる Top K 生成する言葉の候補の上位K個の中から次の言葉を生成する

3. まとめ

34 まとめ本セッションのまとめ Amazon Bedrock は他AWSサービスとの親和性が高く、従量課金のサービスである社内データを組み合わせたRAGが導入しやすく、会社独自の価値が出しやすいおすすめするネクストステッププレイグラウンドでAmazon Bedrock
に触れる社内データを組み合わせたユースケースについて考えてみる AI活用のご相談はぜひサーバーワークスに！

ブースにて生成AI文章検索サービスデモ実施中！お気軽にお試しください！

導入から運用まで！サーバーワークスの生成AI社内活用事例

導入から運用まで！サーバーワークスの生成AI社内活用事例

村上博哉

Other Decks in Technology

Featured

Transcript