Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた(リベ...
Search
KMiura
August 27, 2024
0
150
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた (リベンジ編)
2024/8/27 「製造業でも生成AI活用したい!名古屋LLM MeetUp#2」
https://kinto-technologies.connpass.com/event/325725/
KMiura
August 27, 2024
Tweet
Share
More Decks by KMiura
See All by KMiura
Is it wrong to use a web framework with Lambda?
miura55
0
110
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた
miura55
0
120
AWS×IoTについて語り合う会
miura55
0
84
クラウドを活用して家電をハックしてみた
miura55
0
82
Amplify Gen2でLambda構築してみた
miura55
0
110
Amplify Gen2でLambda構築してみた
miura55
1
770
Amplify Gen2がGAされたので試してみた
miura55
0
120
VS CodeとVimが好きなエンジニアが考えた最強のエディタ
miura55
0
260
オープンソースのロボットソフトウェア「ROS」で地図作成を試してみた
miura55
0
350
Featured
See All Featured
Optimising Largest Contentful Paint
csswizardry
31
2.8k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
30
2.6k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
663
120k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.2k
Documentation Writing (for coders)
carmenintech
65
4.3k
The Mythical Team-Month
searls
218
43k
Imperfection Machines: The Place of Print at Facebook
scottboms
264
13k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
6.8k
Design by the Numbers
sachag
278
19k
Visualization
eitanlees
143
15k
Statistics for Hackers
jakevdp
796
220k
KATA
mclloyd
27
13k
Transcript
Bedrock Knowledge baseを使って今年 の上半期のニュースを聞いてみた (リベンジ編) KMiura(@k_miura_io)
自己紹介 • 三浦 耕生(こうき) • Acallのバックエンドエンジニア • JAWS UG名古屋&神戸 運営
• Cloudflare Meetup名古屋 運営 • 鯱.py 運営 @k_miura_io koki.miura05
このイベントでやったLT覚えてますか?
LTについて今北産業 • Step FunctionsでNews APIを使ってその日のヘッ ドラインニュースをSlackのAPIで投稿するワークフ ロー作った • Slackで投稿するだけではなくAPIのレスポンスログ をS3に溜め込むETL的な機能も用意
• S3に溜め込んだデータをそのままBedrockに使うと いう話
S3のデータをKnowledgebaseにできる 仕組みがあるらしい • Amazon BedrockのKnowledgebaseを使うとS3をソースにフルマネージドなRAGを実現 できそう • 調べてみると外部のベクトルデータベースを使う方法があるが、わざわざ用意しなくても OpenSearch Serverlessを使うことができる(むしろ今のところそれが推奨っぽい)
実際にデモチャットで確認 • 答えは帰って来るがなんか微妙… • 日付周りが結構弱い
どうすれば精度上がりそう? • 読み込ませたソースになっているファイルがAPIのレスポンスをそのまま保存して いるだけなのでCSVとかで整形したほうがいいかも • ソースごとにメタデータ情報を記載したjsonファイルをバケットに足すことで応答精 度が上がるそう 今回はこれを試してリベンジする話
データ生成のフロー • すでに存在するAPIのレスポンスログを溜め込むバケットにデータが保存されたこ とをトリガーでKnowledge Base用のデータを整形 • SQSに流し込んでLambdaでCSVとmetadataのjsonの生成を自動化 • ベクトルデータベースにはPineconeを使用(OpenSearchは高すぎるw)
生成したデータフォーマット
metadata { "metadataAttributes":{ ”year":”2024" } }
それっぽい返答が 出るようになった
上半期のニュースも 抽出できた
DEMO
まとめ • BedrockのKnowledge Baseに対応したデータフォーマットに変換するこ とでAWS上で手軽にRAGを実現できる • metadataを活用することでより適切なデータを取得できた • 多少コードが書けるとデータ整形の自動化がだいぶ楽になる
宣伝 https://bit.ly/4dBnLIf
END