Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた(リベ...
Search
KMiura
August 27, 2024
0
300
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた (リベンジ編)
2024/8/27 「製造業でも生成AI活用したい!名古屋LLM MeetUp#2」
https://kinto-technologies.connpass.com/event/325725/
KMiura
August 27, 2024
Tweet
Share
More Decks by KMiura
See All by KMiura
運用しているアプリケーションのDBのリプレイスをやってみた
miura55
1
1.1k
Amazon Rekognitionを使ったインターホンハック
miura55
0
98
Pythonでルンバをハックしてみた
miura55
0
200
あなたの知らないクラフトビールの世界
miura55
0
380
Storage Browser for Amazon S3を触ってみた + α
miura55
0
240
Cloudflare R2をトリガーにCloudflare Workersを動かしてみた
miura55
0
240
あのボタンでつながるSORACOM
miura55
0
150
Postman Flowsで作るAPI連携LINE Bot
miura55
0
400
Lambdaと共に歩んだAWS
miura55
3
890
Featured
See All Featured
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
280
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
0
410
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
41
エンジニアに許された特別な時間の終わり
watany
106
220k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
115
100k
How GitHub (no longer) Works
holman
316
140k
Transcript
Bedrock Knowledge baseを使って今年 の上半期のニュースを聞いてみた (リベンジ編) KMiura(@k_miura_io)
自己紹介 • 三浦 耕生(こうき) • Acallのバックエンドエンジニア • JAWS UG名古屋&神戸 運営
• Cloudflare Meetup名古屋 運営 • 鯱.py 運営 @k_miura_io koki.miura05
このイベントでやったLT覚えてますか?
LTについて今北産業 • Step FunctionsでNews APIを使ってその日のヘッ ドラインニュースをSlackのAPIで投稿するワークフ ロー作った • Slackで投稿するだけではなくAPIのレスポンスログ をS3に溜め込むETL的な機能も用意
• S3に溜め込んだデータをそのままBedrockに使うと いう話
S3のデータをKnowledgebaseにできる 仕組みがあるらしい • Amazon BedrockのKnowledgebaseを使うとS3をソースにフルマネージドなRAGを実現 できそう • 調べてみると外部のベクトルデータベースを使う方法があるが、わざわざ用意しなくても OpenSearch Serverlessを使うことができる(むしろ今のところそれが推奨っぽい)
実際にデモチャットで確認 • 答えは帰って来るがなんか微妙… • 日付周りが結構弱い
どうすれば精度上がりそう? • 読み込ませたソースになっているファイルがAPIのレスポンスをそのまま保存して いるだけなのでCSVとかで整形したほうがいいかも • ソースごとにメタデータ情報を記載したjsonファイルをバケットに足すことで応答精 度が上がるそう 今回はこれを試してリベンジする話
データ生成のフロー • すでに存在するAPIのレスポンスログを溜め込むバケットにデータが保存されたこ とをトリガーでKnowledge Base用のデータを整形 • SQSに流し込んでLambdaでCSVとmetadataのjsonの生成を自動化 • ベクトルデータベースにはPineconeを使用(OpenSearchは高すぎるw)
生成したデータフォーマット
metadata { "metadataAttributes":{ ”year":”2024" } }
それっぽい返答が 出るようになった
上半期のニュースも 抽出できた
DEMO
まとめ • BedrockのKnowledge Baseに対応したデータフォーマットに変換するこ とでAWS上で手軽にRAGを実現できる • metadataを活用することでより適切なデータを取得できた • 多少コードが書けるとデータ整形の自動化がだいぶ楽になる
宣伝 https://bit.ly/4dBnLIf
END