Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AWS Step Functions と Amazon Bedrock で構築する 可用性の高...

AWS Step Functions と Amazon Bedrock で構築する 可用性の高いAIサービス / Awarefy-AI-AWS-Bedrock-Step-Functions

2024年7月10日に開催された「ヘルスケアスタートアップの最新生成 AI 活用事例祭り【HCLS Startup Day #6 ウェビナー】」の登壇で利用したスライドです。

https://aws-startup-lofts.com/apj/loft/tokyo/event/047593b1-16f5-44ce-8289-c2e365a7d8b2

Takahiro Ikeuchi

July 10, 2024
Tweet

More Decks by Takahiro Ikeuchi

Other Decks in Technology

Transcript

  1. AWS Step Functions と Amazon Bedrock で構築する 可用性の高いAIサービス 株式会社Awarefy 取締役CTO

    池内 孝啓 〜 ヘルスケアスタートアップのAIに対する付加価値との向き合いかた 〜 AWS Startup Loft Tokyo
  2. Agenda アウェアファイについて - 自社・自己紹介 1. AI x AWS・Amazon Bedrock 活用事例

    2. AI x Amazon Aurora PostgreSQL a. AI x AWS Step Functions b. 生成AIを活用して事業価値を生みだすには 3.
  3. 今回お話しすること AWS を活用して実装した2つのAI機能の裏側についてお話しします AIレコメンド メンタルヘルスや生活のお悩みに対する提案を行う推薦システム 採用サービス Amazon Aurora PostgreSQL 要素技術

    : Embedding, RAG, pgvector AIコーチング 用意されたシナリオに基づいて進行するワンランク上の対話システム 採用サービス : Bedrock, AWS Step Functions 要素技術 : メタプロンプト
  4. 単一のAPIをつうじてさまざまな生成AIモデルを利用可能になるサービス アウェアファイでは、Bedrock 上の Anthropic 社のモデルを利用 Claude 3 Opus, Sonnet /

    Claude 3.5 Sonnet Amazon Bedrock アウェアファイでは Anthropic 社のモデルを利用 https://aws.amazon.com/jp/bedrock/
  5. AIコーチングの狙い 従来型AIチャットに対する課題 コーチングは、テーマ設定 → ありたい姿の確認 → 現状の把握 → ... のように、会話の深度によってステップが

    進行していく LLMに対する単純なプロンプト指示では、このステップを管理しながら対話を進行することは難しい 生成AIの実行には数秒〜十数秒かかることも 前処理や後処理など、ステップが多段階に渡る 状態の途中保存やリトライ性を考慮しながら、システムを構築、運用する必要がある AI機能の可用性に対する課題
  6. State Machine 図 天候情報を取得(外部API) 1. プライマリ 生成AIによるコメント生成 2. 失敗した場合、セカンダリ生成AIに処理を委譲 a.

    DB に結果を書き込み・ユーザーに成功を伝える 3. 失敗した場合、ユーザーに失敗を伝える a. ※ AIコーチングについてはより複雑なフローを構築しているため 別の機能(AI Daily Insights)の構成で説明しています。
  7. 生成AIの冗長化はなぜ必要か 生成AIは、サービスの可用性について以下の点を考慮する必要がある 1回の処理に数秒〜十数秒の時間がかかる レートリミットに「トークン」の概念が加わっているのが、非生成AI系サービスとの違い RPM (requests per minute) TPM (tokens

    per minute) など Fail Soft の考えを持ち込む サービスレベルにより、グレードの低いAIで処理を続行できるようにしておく 例)Claude 3 Opus → 処理できない場合 Claude 3 Sonnet を利用 マルチクラウドならぬ マルチ生成AI 体制を構成しておく 例)Bedrock Claude 3 Opus → 処理できない場合 Anthropic Claude 3 Opus を利用