企業向け生成AIアプリの開発から得られた知見

by TakaakiKakei

Slide 1

Slide 1 text

企業向け⽣成AIアプリの開発から得られた知⾒ 2024.7.11 AWS事業本部筧剛彰（Takaaki Kakei）

Slide 2

Slide 2 text

Xへの投稿の際は、ハッシュタグ #cm_odyssey でお願いいたします。 2 お願い

Slide 3

Slide 3 text

⾃⼰紹介筧剛彰（Takaaki Kakei） ● 所属 ○ AWS事業本部 ○ サービスグロースチーム ○ ⽇⽐⾕(東京)オフィス ● 役割 ○ チームリーダー ○ AI-Starterのサービスオーナー ● SNS ○ X（@TakaakiKakei） 3

Slide 4

Slide 4 text

AIを取り巻く状況短期間で様々のサービスやLLMが登場し、AIを取り巻く環境は激しく変化している。 4 Souce 2024年6⽉のAIリリース年表 | npaka Souce Document history for the Amazon Bedrock User Guide

Slide 5

Slide 5 text

⽇本のAI導⼊状況 2023年8⽉~9⽉の実態調査。AIサービスの導⼊率が約2割にとどまる⽇本企業。今後の⽣成AI導⼊の需要はまだまだ⾒込まれる。 5 Source NRIセキュア、日・米・豪の 3か国で「企業における情報セキュリティ実態調査 2023」を実施 | 野村総合研究所

Slide 6

Slide 6 text

⽇本のAI活⽤の可能性横軸が各国のGDPで、縦軸はDX未実施企業の割合。⽇本はDXの余地が⾼く、伸びしろが⼤きい。 6 Souce ⽣成AIの産業における可能性 | 松尾研究所

Slide 7

Slide 7 text

AI導⼊時の選択肢いずれの選択肢も⼀⻑⼀短がある。導⼊⽬的、セキュリティ要件、予算、⾃社技術⼒などを総合的に勘案し、⾃社に最適な選択する。 7 ● ⽣成AIプロバイダーのサービス ○ 代表例は、OpenAIのChatGPT、GoogleのGemini ● SaaS ○ 法⼈向け⽣成AIの導⼊サービスを提供する企業が⼿掛ける ● ⾃社開発 ○ 企業内で⽣成AIシステムを⾃前で開発‧運⽤する選択肢

Slide 8

Slide 8 text

本セッション内容⾃社開発を進める上での具体的な課題や、それらを克服するための知⾒を共有します。 8 ● ⽣成AIプロバイダーのサービス ○ 代表例は、OpenAIのChatGPT、GoogleのGemini ● SaaS ○ 法⼈向け⽣成AIの導⼊サービスを提供する企業が⼿掛ける ● ⾃社開発 ○ 企業内で⽣成AIシステムを⾃前で開発‧運⽤する選択肢

Slide 9

Slide 9 text

Agenda ● ⾃社開発のおける課題と解決策 ○ Part1：信頼性の確保 ○ Part2：拡張性の確保 ○ Part3：運⽤の効率化 ● おまけ ○ Part4：⾃社ソリューションの紹介 9

Slide 10

Slide 10 text

PART 1 信頼性の確保 10

Slide 11

Slide 11 text

信頼性の確保が重要な理由⾃社開発に関わらず、AI導⼊には経営層からの⽀援が必要不可⽋。経営層が慎重な姿勢の場合、「信頼性」が要因の可能性が⾼い。 11 Source ⽣成AIで企業が変わる：現状と課題 | IBM 引⽤）⽣成 AI への投資をためらわせている要因は何だろうか。⼀⾔で⾔えば、「信頼」である。 5 ⼈中 4 ⼈の経営層は、⽣成 AI の導⼊の妨げになっている要因として、信頼に関連する問題が少なくとも 1 つあると考えている。上位にはサイバーセキュリティーやプライバシー、正確性が挙がり、説明可能性や倫理、バイアス（偏⾒や思い込み）についても懸念が広がっている。

Slide 12

Slide 12 text

信頼性に関わる上位の問題 Part1では、信頼性に関わる上位の問題の概要と解決策を提⽰する。 12 ● サイバーセキュリティ ○ AIシステムがサイバー攻撃やデータ侵害から保護されるための措置。 ● プライバシー ○ ユーザーの個⼈情報が適切に管理され、プライバシーが尊重されること。 ● 正確性 ○ AIモデルが信頼性の⾼い情報や決定を出⼒すること。

Slide 13

Slide 13 text

信頼性に関わる上位の問題 Part1では、信頼性に関わる上位の問題の概要と解決策を提⽰する。 13 ● サイバーセキュリティ ○ AIシステムがサイバー攻撃やデータ侵害から保護されるための措置。 ● プライバシー ○ ユーザーの個⼈情報が適切に管理され、プライバシーが尊重されること。 ● 正確性 ○ AIモデルが信頼性の⾼い情報や決定を出⼒すること。

Slide 14

Slide 14 text

サイバーセキュリティへの対応 1/2 ⾃社開発初期は社内ネットワーク内で運⽤すると安⼼。Googleの以下のソリューションは、簡単に認証をかけられるので便利。 14 Source [1] Brand Resource Center [2] Google Apps Script ソリューション例 ● Google CoLaboratory（Colab） ○ Python ○ サンドボックスのような環境 ● Google App Script（GAS） ○ JavaScriptベース ○ 簡単アプリをつくりやすい [1] [2]

Slide 15

Slide 15 text

[参考]CoLabの使い⽅ CoLabで、Azure OpenAIのモデルを呼び出す⽅法を紹介 15 参考 Azure OpenAI Service ⼊⾨ | Takaaki Kakei | Zenn

Slide 16

Slide 16 text

サイバーセキュリティへの対応 2/2 インターネット公開する場合は、厳格なアクセス管理を徹底する。以下のソリューションが便利。あわせて社内有識者や信頼のおける外部パートナーの⼒を借りる。 16 ソリューション例 ● 認証 ○ Auth.js ● WAF ○ AWS WAF ● HTTPS ○ App Runnerは、デフォルトドメインがHTTPS

Slide 17

Slide 17 text

信頼性に関わる上位の問題本セッションでは各問題を以下の通り定義する。⾃社開発においては、それぞれの問題を解決していく必要がある。 17 ● サイバーセキュリティ ○ AIシステムがサイバー攻撃やデータ侵害から保護されるための措置。 ● プライバシー ○ ユーザーの個⼈情報が適切に管理され、プライバシーが尊重されること。 ● 正確性 ○ AIモデルが信頼性の⾼い情報や決定を出⼒すること。

Slide 18

Slide 18 text

プライバシーへの対応 1/3 利⽤⽣成AIプロバイダーで、⼊⼒情報が学習されない⽅法を確認する。 18 ● ⼊⼒情報が学習されないかは重要確認事項。 ● API経由の利⽤では学習されないことが多い。 ● しかし、例外があったりするので要注意。

Slide 19

Slide 19 text

プライバシーへの対応 2/3 利⽤⽣成AIプロバイダーで、⼊⼒情報がどのように監視されるか確認。⾃社ポリシーに沿うかチェックする。 19 ● 前提 ○ ⽣成AIプロバイダーによる監視は、コンプライアンスや法的理由などが挙げられる。 ○ 監視状況は、⽣成AIプロバイダーによってまちまち。 ● ⾃社ポリシーに合致するか確認する ○ ⼊⼒情報が何⽇間保持されるのか ○ ⼊⼒情報への監視⽅法 ○ 監視のオプトアウトできるか

Slide 20

Slide 20 text

プライバシーへの対応 3/3 利⽤⽣成AIプロバイダーで、⼊⼒情報がどのリージョンに置かれるか確認。⾃社ポリシーに沿うかチェックする。 20 ● 前提 ○ ⽇本リージョン対応状況は、⽣成AIプロバイダーによってまちまち。 ● ⾃社ポリシーに合致するか確認する ○ 企業によっては、⽇本リージョン利⽤ではないと⾏けないケースがある。

Slide 21

Slide 21 text

プライバシーの対応状況を確認するの⼤変ですよね 21

Slide 22

Slide 22 text

主要⽣成AIプロバイダーの記載場所をまとめました 22

Slide 23

Slide 23 text

[参考]主要⽣成AIプロバイダーの状況ポリシーが更新される場合もあるので公式から最新情報を常に確認すること。 23 ● OpenAI ○ モデルのパフォーマンスを向上させるためにデータがどのように使⽤されるか | OpenAI ヘルプセンター ● Azure OpenAI ○ Azure インフラストラクチャのセキュリティ ○ Azure OpenAI Service による保存データの暗号化 ○ Data, privacy, and security for Azure OpenAI Service ● Amazon Bedrock ○ Amazon Bedrock のセキュリティ ○ Amazon Bedrock abuse detection ○ ⽇本におけるプライバシーに関する考慮事項に照らした AWS の利⽤ ● Google ○ Google AI と Vertex AI の違い ○ Gemini アプリのプライバシーハブ ○ Gemini API 追加利⽤規約 ○ ⽣成 AI とデータガバナンス ● その他（⾮公式） ○ ChatGPT APIリリースに伴ってOpenAIのAPIデータ利⽤ポリシーが改定されたので読んでみた ○ Amazon Bedrockの規約周りの情報を読んでみる ○ [⽐較表] Azure OpenAIと本家OpenAI APIの⽐較表 ○ Geminiのキャッチアップ

Slide 24

Slide 24 text

信頼性に関わる上位の問題本セッションでは各問題を以下の通り定義する。⾃社開発においては、それぞれの問題を解決していく必要がある。 24 ● サイバーセキュリティ ○ AIシステムがサイバー攻撃やデータ侵害から保護されるための措置。 ● プライバシー ○ ユーザーの個⼈情報が適切に管理され、プライバシーが尊重されること。 ● 正確性 ○ AIモデルが信頼性の⾼い情報や決定を出⼒すること。

Slide 25

Slide 25 text

正確性への対応 1/1 ⽣成AIは、質問に対して必ずしも正しい答えを返すわけではない。ハルシネーション対策をシステムに組み込む。 25 ● 対応 ○ AIの回答は必ずしも正確とは限らない旨を、システムの画⾯に出したり、周知することで、ユーザーに誤解を与えないようにする ○ ⽣成AIと社内データを組み合わせる場合は、回答の参照元を明⽰させる [1] Geminiアプリ画⾯の注意書き [2] グラウンディングの概要 | Google Cloud

Slide 26

Slide 26 text

信頼性の確保まとめ 26 ● サイバーセキュリティ ○ AIシステムがサイバー攻撃やデータ侵害から保護されるための措置。 ■ ⾃社開発の初期は社内ネットワークで運⽤ ■ インターネット公開時は、厳格なアクセス管理を徹底 ● プライバシー ○ ユーザーの個⼈情報が適切に管理され、プライバシーが尊重されること。 ■ ⼊⼒情報が学習されないか ■ ⼊⼒情報がどのように監視されるか ■ ⼊⼒情報がどのリージョンに置かれるか ● 正確性 ○ AIモデルが信頼性の⾼い情報や決定を出⼒すること。 ■ システム画⾯に出す、周知 ■ グラウンディング

Slide 27

Slide 27 text

PART 2 拡張性の確保 27

Slide 28

Slide 28 text

拡張性の確保が重要な理由経営層は、能⼒拡張に期待を寄せているため。 28 Source ⽣成AIで企業が変わる：現状と課題 | IBM 引⽤） > 彼らが特に期待を寄せるのは、コンテンツの質向上や競争優位性の促進、従業員の専⾨性拡充などだ。総じて経営層は、AI によるエクスペリエンス（体験）向上を通じて、能⼒を拡張し、成⻑を促すことを重視している。⼀⽅で、コスト削減にはそれほど重きを置いていない（図 3 参照）。

Slide 29

Slide 29 text

拡張性に関わる観点本セッションでは以下の観点に着⽬する。 29 ● LLMの観点 ○ どのLLMを採⽤するか ● UIの観点 ○ どのようなUIで提供するか ● 実⽤性の観点 ○ どのような価値が求められるか

Slide 30

Slide 30 text

LLMの観点どのLLMを利⽤するかで得られる回答が異なる。特定のLLMへのロックインは⾮推奨。⾃社技術⼒を考慮して適切なサービスやライブラリを採⽤する。 30 ● 前提 ○ 回答品質‧速度‧価格の観点で、最新LLMを使うのが⼀番 ○ おすすめのLLMは、数ヶ⽉の間隔で変わっていく ○ ユースケースによっておすすめのLLMも異なる ● 各LLMをラップしたサービスやライブラリをうまく使う ○ Vercel AI SDK ○ Amazon Bedrock ○ Cloudﬂare AI Gateway

Slide 31

Slide 31 text

[参考] Vercel AI SDK 主要な⽣成AIプロバイダーのモデルを、統⼀された書き⽅で呼び出すことができる 31 Source Vercel AI SDK

Slide 32

Slide 32 text

[参考] Amazon Bedrock 主要な⽣成AIプロバイダーのモデルをサポート。Converse APIを利⽤すると、統⼀された書き⽅で呼び出すことができる。 32 Source Amazon Bedrock でサポートされている基盤モデル

Slide 33

Slide 33 text

[参考] Cloudﬂare AI Gateway 主要な⽣成AIプロバイダーのモデルをサポート。ゲートウェイ機能としてCachingやRate limiting も。 33 Source Cloudﬂare AI Gateway

Slide 34

Slide 34 text

[参考] どの⽣成AIモデルが流⾏かおすすめの海外サイトを紹介。 34 https://artiﬁcialanalysis.ai/ https://chat.lmsys.org/?leaderboard

Slide 35

Slide 35 text

UIの観点どのUIを採⽤するかで届けられる価値が異なる。⾃社開発⼒と天秤をかけて決める。OSSをうまく活⽤すると開発のハードルを下げることができる。 35 ● 主な選択肢 ○ コミュニケーションツール（Slack，Teamsなど） ○ Web UI ○ Chrome拡張機能 ● 信頼のおけるOSSをうまく活⽤して開発するのを推奨 ○ ChatGPT-in-Slack | seratch ○ generative-ai-use-cases-jp | aws-samples

Slide 36

Slide 36 text

[参考] ChatGPT-in-Slack Slack Bolt（Slack開発のフレームワーク）開発者のseratch⽒のOSS。SlackとOpenAIを組み合わせたAI Botを作成できる。 36 Source ChatGPT-in-Slack | seratch

Slide 37

Slide 37 text

[参考] generative-ai-use-cases-jp AWSのリポジトリで公開されているOSS。ビジネスユースケース集に沿ったWeb UI。ブラウザ拡張機能も提供している。 37 Source generative-ai-use-cases-jp | aws-samples

Slide 38

Slide 38 text

実⽤性の観点 RAG機能や個別アシスタント機能の需要は⾼い。あらかじめ⾒据えて開発する。 38 ● RAG機能 ○ 通常、⽣成AIは学習したデータに含まれている内容以外に関する質問には回答ができない ○ ユーザからの質問に回答するために必要な情報が書かれた⽂章を検索し、その⽂章を⽣成AIへの⼊⼒（プロンプト）に付け加えて渡すことで、ユーザが欲しい情報に関して回答させる ● 個別アシスタント機能 ○ 実運⽤すると業務特化したアシスタントの需要が増える ○ アシスタントやBotをスケールできるような仕組みを⾒据えて開発する Source ChatGPTアプリの画⾯

Slide 39

Slide 39 text

拡張性の確保まとめ拡張性の確保については、以下の観点にそれぞれ対応していくことが重要。 39 ● LLMの観点 ○ どのLLMを採⽤するか ■ 特定のLLMへのロックインは⾮推奨。 ■ ⾃社技術⼒を考慮して適切なサービスやライブラリを採⽤する。 ● UIの観点 ○ どのようなUIで提供するか ■ ⾃社開発⼒を考慮して決める。 ■ OSSをうまく活⽤する。 ● 実⽤性の観点 ○ どのような価値が求められるか ■ RAG機能や個別アシスタント機能を⾒据えて開発する。

Slide 40

Slide 40 text

PART 3 運⽤の効率化 40

Slide 41

Slide 41 text

運⽤の効率化に関わる観点本セッションでは以下の観点に着⽬する。 41 ● アーキテクチャの観点 ○ どのようなアーキテクチャを採⽤するか ● 分析‧監視の観点 ○ 何のために何をどのように監視するか ● フィードバックの観点 ○ 利⽤者からのフィードバックをどう得るか

Slide 42

Slide 42 text

アーキテクチャの観点⽣成AIの動向を追うだけでも⼤変。なるべくマネージドなサービスを活⽤して運⽤負荷を軽減する。 42 ● AWSのサービス例 ○ ECS Fargate ○ App Runner ○ Knowledge Base ○ DynamoDB ○ S3 ○ Secrets Manager Source generative-ai-use-cases-jp | aws-samples

Slide 43

Slide 43 text

分析‧監視の観点⽬的を明確にして、適切なサービスを選択する。AWSならば、CloudWatch Logsのクエリを保存するなどして運⽤を効率化。 43 ● AWSのサービス例 ○ CloudWatch Logs ○ EventBridge ○ Amazon SNS ○ AWS Chatbot ● 分析項⽬例 ○ 利⽤者数 ○ チャット回数 ○ 利⽤アシスタントランキング

Slide 44

Slide 44 text

フィードバックの観点利⽤者とコミュニケーションがとりやすい⽅法を採⽤する。専⽤チャンネルを作成してコミュニティ的に運⽤するほうが双⽅向のコミュニーションができて、改善しやすいことも。 44 フィードバックのもらい⽅のおすすめ ● コミュケーションツールの専⽤チャンネル ● アプリ上からのフィードバック画⾯

Slide 45

Slide 45 text

運⽤の効率化まとめ運⽤の効率化に関しては、⾃社開発では以下の観点にそれぞれ対応していくことが重要。 45 ● アーキテクチャの観点 ○ どのようなアーキテクチャを採⽤するか ■ なるべくマネージドなサービスを活⽤して運⽤負荷を軽減する。 ● 分析‧監視の観点 ○ 何のために何をどのように監視するか ■ ⽬的を明確にして、適切なサービスを選択する。 ■ CloudWatch Logsのクエリ保存は便利。 ● フィードバックの観点 ○ 利⽤者からのフィードバックをどう得るか ■ 利⽤者とコミュニケーションがとりやすい⽅法を採⽤する。

Slide 46

Slide 46 text

PART 4 ⾃社ソリューションの紹介 46

Slide 47

Slide 47 text

[宣伝] AI-Starter 複数の⽣成AIサービスを1つのプラットフォームでシームレスに利⽤可能。お客様のAWSアカウントにデプロイされるため、データはセキュアに管理され、プライバシーも安⼼。パッケージでの提供のため、導⼊もスムーズ。 47 参考⽣成AI環境構築サービス「AI-Starter」 | クラスメソッド株式会社

Slide 48

Slide 48 text

AI-Starter 信頼性の確保⼊⼒情報が学習されない⽅法や情報を提供。お客様の認証プロバイダーに対応。参照元表⽰したり、注意書きをかくこと（新UI）でハルシネーション対策。 48

Slide 49

Slide 49 text

AI-Starter 拡張性の確保主要な⽣成AIプロバイダーのLLMに対応。スクラッチのWeb UI開発で柔軟な表現。 49

Slide 50

Slide 50 text

AI-Starter 運⽤の効率化サーバレスアーキテクチャでパッケージ管理。CloudWatch LogsやEventBridgeを利⽤して分析‧ 監視。社内では専⽤のSlackチャネル作成。お客様とはBacklog等でコミュニケーション。 50 参考⽣成AI環境構築サービス「AI-Starter」 | クラスメソッド株式会社