生成AIで本番アプリをリリースするためのAWS, LangChain, ベクターデータベース実践入門 / LangChain-Bedrock

© 2023, Amazon Web Services, Inc. or its affiliates. All
rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS AI Week for Developers ⽣成AIで本番アプリをリリースするための AWS, LangChain, ベクターデータベース実践⼊⾨吉⽥真吾取締役CTO 株式会社サイダス

rights reserved. 吉田真吾 AWS Serverless Hero n p Oracle SA p 113 / pAWS n ( ) CTO p SaaS ( ) pAWS DevOps n pAWS (2012 ) pAWS Samurai 2014 / 2016 pAWS Serverless Hero AWS AWS Lambda Amazon S3

rights reserved.

rights reserved. https://www.cydas.co.jp/news/press/202304_people-gpt/ 「CYDAS PEOPLE」に、社員からの問い合わせに⾃動で答えるChatGPT機能「CYDAS Copilot Chat」をリリース

rights reserved. 6

rights reserved. ChatGPT/LangChainによるチャットシステム構築[実践]⼊⾨本書ではまず、OpenAI APIとLangChainについて解説します。 ChatGPTのようなしくみを業務システムなどに組み込むためには、単にLLMに1つ⼊⼒して1つ出⼒を得るような実装ではなく、複数のタスクを⼀連のワークフロー処理として実現する必要があります。また、ChatGPTが知識を持たない専⾨知識を答えてほしいとか、意図した形式で応答が欲しいなど、実⽤性を⾼める必要も出てきます。これらを実現するためのLangChain のつかいかたをわかりやすく解説します。後半では、ステートレスなOpenAI APIに記憶を持たせたり、必要に応じてWeb検索などを⾏うエージェント処理、さらにそれらチャット形式の処理を、ステップバイステップでWeb アプリやSlackアプリとして実装します。さらに、LLMアプリを本番稼働させるうえで必要となる、ユーザー体験、セキュリティ、コンプライアンスへの準拠などのためのヒントや注意点も解説します。 7

rights reserved. ChatGPT/LangChainによるチャットシステム構築[実践]⼊⾨ 8 質問に対してDuckDuckGoで外部検索して答えるWebアプリ LLM を組み込んだチャットアプリケーションを写経しながら実装できる「ChatGPT/LangChain によるチャットシステム構築［実践］⼊⾨」を読んだ https://kakakakakku.hatenablog.com/entry/2023/10/16/085525 アップロードしたドキュメントについて答えるSlackアプリ

rights reserved. ⽣成AIでできること 1.⾔語⽣成 2.画像⽣成・動画⽣成 3.⾳声⽣成 4.マルチモーダル = 画像＋⾔語→⾔語、⾔語→動画＋⾔語、など⾔語⽣成 • ⽂章⽣成、⽂章要約 • RAG(検索拡張⽣成) • 外部エージェントを利⽤したさまざまなアシスタント 9 メール⽂章の作成

rights reserved. ⽣成AIでできること 10 事業企画アシスタント 1on1相⼿コード⽣成最新のマーケットリサーチ

rights reserved. LLMアプリをつくるときに開発者が考えること 1.モデルの開発や選定について基盤モデルから作る = コスト「超⼤」カスタマイズ(ファインチューニング) = コスト「中」 RAGなどLLM性能＋外部知識を利⽤する = コスト「低」 2.モデルをホストする計算資源(CPU/GPU)について⾃社でホストする = コスト「⼤」 APIで利⽤する = コスト「低」 3.既存のシステムとの統合(ガバナンス) マルチクラウドで実装する = コスト「中」ファーストパーティのみで実装する = コスト「低」 → 現有のモデル＋API利⽤＋ファーストパーティ(AWSユーザーならAWS)が開発者にとってもっともROIが⾼い 11

rights reserved. Amazon Bedrock 12 https://aws.amazon.com/jp/bedrock/

rights reserved. LLMの能⼒をシステムに組み込みたい 1.API経由で使うモデルの選定 Amazon Bedrock > ClaudeやTitanFM、HuggingFace上のモデルの選定 2.アプリケーションフレームワークからユースケースに合わせて抽象化して利⽤する LangChainなどのフレームワークで - 品質の安定したプロンプティング - モデルやパラメータの変更耐性に強いコード - キャッシュ、データベース、プラグインなどの統合利⽤ 3.ベクターデータベースや追加オプションなど、新たな技術スタックの統合データ中⼼のアプローチ > Data Gravity tl;dr データ移動やコピーはコストがかかる、ロバスト性や完全性の懸念 13

rights reserved. LangChainとは 14 • LLMをつかったアプリケーション開発のフレームワークライブラリ • モデル/メモリ/エージェント/Retriever などの機能が抽象化されており、少ないコードで効率的な開発・アウトプットが得られる • 開発初期において複雑なプロンプトエンジニアリングにかかる⼿間がユースケースに合致したテンプレートを⾒つけることで⼀気に短縮することも可能

rights reserved. ベクターデータベースとは AWSで利⽤可能なベクターDBオプション • Amazon RDS for PostgreSQL - pgvector • Amazon Aurora PostgreSQL – pgvector • Amazon OpenSearch Service • Amazon Neptune ML LangChainでつかえるさまざまなベクターDB • Pinecone • Chroma (ローカル) • Momento Vector Index • PGVector • Redis (Redisearchオプション) • Elasticsearch • MongoDB Atlas • Supabase (Postgres) • OpenSearch • etc… 15 ⽂章や画像から、コンピューターが⾔語処理や解析しやすいベクトル空間の数値データに変換した「⾼次元ベクトル」のデータをホストすることで、インプットと類似度で検索が可能なデータベース。単語やフレーズをインプットとして、意味の類似する⽂書のチャンクを取り出す⽬的などに利⽤される。 https://python.langchain.com/docs/integrations/vectorstores/ https://aws.amazon.com/jp/what-is/vector-databases/ https://aws.amazon.com/jp/about-aws/whats- new/2023/07/amazon-aurora-postgresql-pgvector-vector-storage- similarity-search/

rights reserved. LangChain + Amazon Bedrock(Titan/Claude) + Pinecone 16 aws-samples/amazon-bedrock-workshop https://github.com/aws-samples/amazon-bedrock-workshop/blob/main/03_QuestionAnswering/02_rag_claude_titan_pinecone.ipynb

rights reserved. 本番リリースする前に[観測・テスト・評価] • ユースケースにあわせたテスト評価セットの事前作成 • 現在、独⾃の知識をもちいたRAGや、エージェントツールに対して万能に精度を評価する有効性の⾼いソリューションはない。 • LangSmithで以下の値を参考にしてテストする • P99 Latency • Tokens (消費) • Input / Retrival結果 / Output 17

rights reserved. LangSmith 18

rights reserved. LangSmith 19

rights reserved. 本番リリースする前に[セキュリティについて] • 意図しないコンテンツの⼊⼒防⽌チャットボットの質問など、⼊⼒コンテンツに意図しないものを含まないよう、アプリケーションのUIでガイダンスを設置する。⼊⼒フィルター機能が使える場合は使う • 不適切な出⼒の回避暴⼒的な発⾔や偏⾒、不快なコンテンツのチェック→排除。出⼒フィルター機能が使える場合は使うレイテンシと安全性のトレードオフを加味する。 • プロンプトインジェクションの防⽌⼊⼒コンテンツで指⽰を上書きし、任意の指⽰を可能にする攻撃。⼊⼒プロンプトによって指⽰が上書きされないようなプロンプトテンプレートの構成をおこなうこと。 • トークンを⼤量に消費させる攻撃の防⽌⼊⼒コンテンツの⻑さチェックや、⼀定時間内の実⾏回数やトークン消費量に上限を設けるなどして、リクエスト内容に制限をかける。 20 • 安全でない出⼒コンテンツのチェック LLMアプリケーションの出⼒内容が、システム全体にとって安全でない内容(たとえばXSSやCSRFを引き起こすコードなど)を出⼒しないように、出⼒コンテンツのチェックをおこない、⼀律の⽂字列エンコード処理などをおこなう。 • 脆弱性の排除新しいライブラリやフレームワークの導⼊、リリースパイプラインの構築で、脆弱性が混⼊しうるポイントが増える。現⾏システムと同等の脆弱性対応を実施する。 • エージェントを暴⾛させない外部接続性・実⾏性が⾼いエージェントを暴⾛させない。エージェント = 前⼯程でLLMが⽣成したコンテンツから次⼯程の指⽰を推論することでワークフローを達成しようと動作する.。実⾏可能な外部機能を最⼩限にし、操作対象の権限(データの取得・編集・削除など)を最⼩化する。⼗分なケースでテストを実施する。 OWASP Top 10 for Large Language Model Applications https://owasp.org/www-project-top-10-for-large-language-model-applications/

生成AIで本番アプリをリリースするためのAWS, LangChain, ベクターデータ...

生成AIで本番アプリをリリースするためのAWS, LangChain, ベクターデータベース実践入門 / LangChain-Bedrock

吉田真吾

More Decks by 吉田真吾

Other Decks in Programming

Featured

Transcript

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All

© 2023, Amazon Web Services, Inc. or its affiliates. All