Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた(リベ...
Search
KMiura
August 27, 2024
0
200
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた (リベンジ編)
2024/8/27 「製造業でも生成AI活用したい!名古屋LLM MeetUp#2」
https://kinto-technologies.connpass.com/event/325725/
KMiura
August 27, 2024
Tweet
Share
More Decks by KMiura
See All by KMiura
あなたの知らないクラフトビールの世界
miura55
0
100
Storage Browser for Amazon S3を触ってみた + α
miura55
0
120
Cloudflare R2をトリガーにCloudflare Workersを動かしてみた
miura55
0
130
あのボタンでつながるSORACOM
miura55
0
77
Postman Flowsで作るAPI連携LINE Bot
miura55
0
280
Lambdaと共に歩んだAWS
miura55
3
640
Is it wrong to use a web framework with Lambda?
miura55
0
160
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた
miura55
0
170
AWS×IoTについて語り合う会
miura55
0
110
Featured
See All Featured
Build your cross-platform service in a week with App Engine
jlugia
229
18k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Designing Experiences People Love
moore
139
23k
How to Think Like a Performance Engineer
csswizardry
22
1.3k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
How STYLIGHT went responsive
nonsquared
96
5.3k
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
Building Your Own Lightsaber
phodgson
104
6.2k
Thoughts on Productivity
jonyablonski
68
4.4k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.5k
Transcript
Bedrock Knowledge baseを使って今年 の上半期のニュースを聞いてみた (リベンジ編) KMiura(@k_miura_io)
自己紹介 • 三浦 耕生(こうき) • Acallのバックエンドエンジニア • JAWS UG名古屋&神戸 運営
• Cloudflare Meetup名古屋 運営 • 鯱.py 運営 @k_miura_io koki.miura05
このイベントでやったLT覚えてますか?
LTについて今北産業 • Step FunctionsでNews APIを使ってその日のヘッ ドラインニュースをSlackのAPIで投稿するワークフ ロー作った • Slackで投稿するだけではなくAPIのレスポンスログ をS3に溜め込むETL的な機能も用意
• S3に溜め込んだデータをそのままBedrockに使うと いう話
S3のデータをKnowledgebaseにできる 仕組みがあるらしい • Amazon BedrockのKnowledgebaseを使うとS3をソースにフルマネージドなRAGを実現 できそう • 調べてみると外部のベクトルデータベースを使う方法があるが、わざわざ用意しなくても OpenSearch Serverlessを使うことができる(むしろ今のところそれが推奨っぽい)
実際にデモチャットで確認 • 答えは帰って来るがなんか微妙… • 日付周りが結構弱い
どうすれば精度上がりそう? • 読み込ませたソースになっているファイルがAPIのレスポンスをそのまま保存して いるだけなのでCSVとかで整形したほうがいいかも • ソースごとにメタデータ情報を記載したjsonファイルをバケットに足すことで応答精 度が上がるそう 今回はこれを試してリベンジする話
データ生成のフロー • すでに存在するAPIのレスポンスログを溜め込むバケットにデータが保存されたこ とをトリガーでKnowledge Base用のデータを整形 • SQSに流し込んでLambdaでCSVとmetadataのjsonの生成を自動化 • ベクトルデータベースにはPineconeを使用(OpenSearchは高すぎるw)
生成したデータフォーマット
metadata { "metadataAttributes":{ ”year":”2024" } }
それっぽい返答が 出るようになった
上半期のニュースも 抽出できた
DEMO
まとめ • BedrockのKnowledge Baseに対応したデータフォーマットに変換するこ とでAWS上で手軽にRAGを実現できる • metadataを活用することでより適切なデータを取得できた • 多少コードが書けるとデータ整形の自動化がだいぶ楽になる
宣伝 https://bit.ly/4dBnLIf
END