Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
knowledge base fot amazon bedrockを使って、格安でRAG作ってみた
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
そのだ
January 27, 2024
Technology
2k
1
Share
knowledge base fot amazon bedrockを使って、格安でRAG作ってみた
【doorkeeper】
https://jawsug-saga.doorkeeper.jp/events/166448
そのだ
January 27, 2024
More Decks by そのだ
See All by そのだ
Google_ADKのSub_AgentをAgentic_Workflowに移行し_遷移成功率を改善した話.pdf
sonoda_mj
1
110
仕事はAIに任せてラスベガスへ行きたいのでDSPyで自分のクローンを作った
sonoda_mj
1
150
ハッカソンから社内プロダクトへ AIエージェント「ko☆shi」開発で学んだ4つの重要要素
sonoda_mj
6
2.6k
RAGの基礎から実践運用まで:AWS BedrockとLangfuseで実現する構築・監視・評価
sonoda_mj
1
1.9k
Amazon Bedrock Knowledge Basesに Data Autometionを導入してみた
sonoda_mj
1
230
Amazon Bedrock Knowledge basesにLangfuse導入してみた
sonoda_mj
2
1.1k
AIエージェントに脈アリかどうかを分析させてみた
sonoda_mj
2
420
Amazon Bedrock Knowledge Basesのアップデート紹介
sonoda_mj
2
880
Snowflake未経験の人がSnowflakeに挑戦してみた
sonoda_mj
1
280
Other Decks in Technology
See All in Technology
電子辞書Brainをネットに繋げてみた(自力編)
raspython3
0
230
AI活用の格差をなくす:チーム全体のAI開発生産性を底上げする方法
moongift
PRO
1
110
Amazon Bedrock 経由の Claude Cowork を試してみよう・MCP にも繋いでみよう
sugimomoto
0
210
long-running-tasks
cipepser
2
410
『家族アルバム みてね』における インシデント対応との向き合い方 / Approach incident response in Family Album
kohbis
2
230
Copilot CLI・IDE・Web・スマホで途切れない開発フローを目指して / One Copilot flow - CLI IDE Web Mobile
aeonpeople
1
1.1k
A Harness for Behaviour: how to get AI to generate code that does what we intend, or "TDD in the age of AI"
xpmatteo
0
470
人が担う「価値」とは?これからの「QA」とは / Human Value and the Future of Quality Assurance
bitkey
PRO
0
110
Javaコミュニティをもっと楽しむための9箇条
takasyou
0
290
OpenClawとHermesAgentでAI新入社員を作った話
takanoriyanada
0
130
管理アカウント単一運用からAWS Organizationsに移行するの大変で滅
hiramax
0
270
Cloud Run のアップデート 触ってみる&紹介
gre212
0
170
Featured
See All Featured
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
400
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
540
The Curse of the Amulet
leimatthew05
1
12k
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Code Reviewing Like a Champion
maltzj
528
40k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
130
The Invisible Side of Design
smashingmag
302
52k
Into the Great Unknown - MozCon
thekraken
41
2.5k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
240
Transcript
Knowledge Base for Amazon Bedrockと Pineconeを使って、格安でRAG作ってみた 【オフライン】JAWS-UG佐賀 2024年新年会LT 〜佐賀のエンジニアで乾杯︕〜 2024.1.27
苑⽥朝彰 1
⾃⼰紹介 苑⽥ 朝彰 Sonoda Tomotada - ID - Github︓tomomj -
Twitter︓@sonoda_mj - Work at - 株式会社 Fusic (フュージック) 技術創造部⾨所属 - ソフトウェアエンジニアリング - 新卒3年⽬ - Skill - AWS/React(Native)/Ruby on Rails 2
⾃⼰紹介 苑⽥ 朝彰 Sonoda Tomotada - ID - Github︓tomomj -
Twitter︓@sonoda_mj - Work at - 株式会社 Fusic (フュージック) 技術創造部⾨所属 - ソフトウェアエンジニアリング - 新卒3年⽬ - Skill - AWS/React(Native)/Ruby on Rails 3
アジェンダ 4 l 背景 l 事前知識 l knowledge base for
amazon bedrockとPineconeを使って、格安で RAG作ってみた l まとめ
01 背景
RAG面白そうだから 作ってみたい!!
従来のAWSにおけるRAG 7 引用:https://aws.amazon.com/jp/blogs/news/quickly-build-high-accuracy-generative-ai-applications- on-enterprise-data-using-amazon-kendra-langchain-and-large-language-models/
従来のAWSにおけるRAG 8 引用:https://aws.amazon.com/jp/blogs/news/quickly-build-high-accuracy-generative-ai-applications- on-enterprise-data-using-amazon-kendra-langchain-and-large-language-models/ 試すにはちょっと 高い。。。
ほっ…ほなVectorDBだけ安くし て、処理部分を自分で作ろう!
コサイン類似度 Embedding Model
コサイン類似度 Embedding Model ML初心者にはしんどい
手軽に安く作れる方法 はないんか!!
None
なんか簡単に作れそう
これ使ってみよか〜
できるだけ工数やお金をかけずに RAGを作って遊びたい!!
02 事前知識
事前知識 18 l 検索拡張生成(RAG)とは l Knowledge Base For Amazon Bedrockとは
l Pineconeとは
事前知識 19 l 検索拡張生成(RAG)とは l Knowledge Base For Amazon Bedrockとは
l Pineconeとは
検索拡張⽣成(RAG)とは 20 Retrieval Augmented Generation(RAG) 生成系の言語 AI モデルに外部メモリをつけるというコンセプトのことを指す Vector Database
LLM 質問 検索 返答 検索結果 引用:https://github.com/aws-samples/jp-rag-sample
検索拡張⽣成(RAG)とは 21 事前に学習したデータに関しては返答することができる AWSについて教えて AWSってのはな・・・ LLM
検索拡張⽣成(RAG)とは 22 しかし、学習していない内容に関しては答えられない 苑田について教えて 誰やねん 私の知識はxxxx年まででぇ〜
検索拡張⽣成(RAG)とは 23 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 苑田について教えて 新しいデータをベクトル化 して格納
検索拡張⽣成(RAG)とは 24 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 近いベクトルを探す 「苑田について教えて」を ベクトル化
検索拡張⽣成(RAG)とは 25 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 検索結果を返す
検索拡張⽣成(RAG)とは 26 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 苑田ってのはな
事前知識 27 l 検索拡張生成(RAG)とは l Knowledge Base For Amazon Bedrockとは
l Pineconeとは
Bedrockとは 28 "*-BCTɺ"OUISPQJDɺ$PIFSFɺ.FUBɺ4UBCJMJUZ"*ɺ"NB[POͳͲͷେख "*اۀ͕ఏڙ͢Δ ߴੑೳͳج൫Ϟσϧ '. Λ୯Ұͷ "1*ͰબͰ͖ΔϑϧϚωʔδυܕαʔϏε ↓これらのmodelのAPIが使える
Knowledge Base for Amazon Bedrockとは 29 "NB[PO#FESPDLͷφϨοδϕʔεΛ༻͢Δͱɺ"NB[PO#FESPDL͔Β '.Λσʔλιʔ εʹଓͯ͠ݕࡧ֦ுੜ 3"(
Λߦ͏͜ͱ͕Ͱ͖Δɻ͜ΕʹΑΓɺ'.ͷطଘͷڧྗͳػೳΛ ֦ு͠ɺಛఆͷυϝΠϯ৫ʹؔ͢ΔࣝΛਂΊΔ͜ͱ͕Ͱ͖Δɻ 引用:https://aws.amazon.com/jp/bedrock/knowledge-bases/
データの前処理 30 引用:https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html • ドキュメントを管理しやすいチャンクに分割し、効率的に取得できるようにする • ドキュメントをEmbedding Modelを使用してベクトル化する • Vector
DBに格納する Cohere
ランタイム実⾏ 31 引用:https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html • ユーザーのクエリをベクトル化する • ドキュメントのベクトルと比較し、意味的に類似したチャンクが検索される • 取得されたチャンクからの追加のコンテキストで拡張される Cohere
Claude
Knowledge Baseについて詳しく 32 or or Vector Database Data Source S3
Bedrock User LLM 様々な情報を入れる コードを書かなくとも一括で作成してくれる(S3以外) or
事前知識 33 l 検索拡張生成(RAG)とは l Knowledge Base For Amazon Bedrockとは
l Pineconeとは
Pineconeとは 34 ベクトルを保存するためのデータベース(freeプランを使用) 引用:https://www.pinecone.io/product/
03 knowledge base for amazon bedrock を使って、格安でRAG作ってみた
データソース 36 Fusicのメンバー紹介(全員分) 参考: https://fusic.co.jp/members/108
Slack Bedrock 苑田(webにない情報) って誰ですか?
Slack Bedrock 苑田って何ですか?
Slack Bedrock 苑田というのは。。。
Slack Bedrock 苑田というのは。。。
構成図 41
構成図 42 構築の手間がかからない
構成図 43 フリープランなら無料
構成図 44 モデル 入力トークン 1,000 個あたり 出力トークン 1,000 個あたり Claude
0.00800 USD 0.02400 USD Cohere(埋め込み — 多言語) 0.0001 USD 該当なし
構成図 45 モデル 入力トークン 1,000 個あたり 出力トークン 1,000 個あたり Claude
0.00800 USD 0.02400 USD Cohere(埋め込み — 多言語) 0.0001 USD 該当なし め っ ち ゃ 安 い !
デモ
04 まとめ
まとめ Knowledge Base for Bedrockを使⽤することで、簡単にRAGを構築することができた Point 2 Pineconeを使⽤することで、⽐較的安く構築することができた 48 Point
1 Point 3 SlackでRAGを簡単に使⽤することができた
ご清聴いただきありがとうございました Thank You We are Hiring ! https://recruit.fusic.co.jp/