Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
Search
為藤アキラ
February 06, 2025
Technology
0
41
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
為藤アキラ
February 06, 2025
Tweet
Share
More Decks by 為藤アキラ
See All by 為藤アキラ
Bedrock カスタムモデルvs汎用モデルの比較
akiratameto
1
79
Amazon Bedrock Agents (ナレッジベースの種類)
akiratameto
1
100
DeepSeek-R1をカスタムモデルとしてAmazon Bedrockにインポートし活用
akiratameto
0
120
Amazon Bedrock Agents (基本編)
akiratameto
0
70
SageMaker Feature Storeを活かしたLLM推論
akiratameto
0
31
Other Decks in Technology
See All in Technology
ExaDB-XSで利用されているExadata Exascaleについて
oracle4engineer
PRO
3
240
データエンジニアリング領域におけるDuckDBのユースケース
chanyou0311
8
2.1k
PHPカンファレンス名古屋-テックリードの経験から学んだ設計の教訓
hayatokudou
2
540
PHPで印刷所に入稿できる名札データを作る / Generating Print-Ready Name Tag Data with PHP
tomzoh
0
180
Potential EM 制度を始めた理由、そして2年後にやめた理由 - EMConf JP 2025
hoyo
2
2.5k
サイト信頼性エンジニアリングとAmazon Web Services / SRE and AWS
ymotongpoo
7
1.4k
手を動かしてレベルアップしよう!
maruto
0
200
Exadata Database Service on Cloud@Customer セキュリティ、ネットワーク、および管理について
oracle4engineer
PRO
2
1.5k
OPENLOGI Company Profile
hr01
0
60k
Perlの生きのこり - エンジニアがこの先生きのこるためのカンファレンス2025
kfly8
2
270
依存パッケージの更新はコツコツが勝つコツ! / phpcon_nagoya2025
blue_goheimochi
3
210
Cracking the Coding Interview 6th Edition
gdplabs
14
28k
Featured
See All Featured
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Become a Pro
speakerdeck
PRO
26
5.2k
We Have a Design System, Now What?
morganepeng
51
7.4k
Six Lessons from altMBA
skipperchong
27
3.6k
Gamification - CAS2011
davidbonilla
80
5.2k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
A better future with KSS
kneath
238
17k
A Tale of Four Properties
chriscoyier
158
23k
Fontdeck: Realign not Redesign
paulrobertlloyd
83
5.4k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
10
510
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
Transcript
Google Cloud活用 AI/ML/LLM #1 機械学習 (ML) / 大規模言語モデル(LLM) の為のデータ準備 Vertex
AIで実現するLLMデータ アノテーションの効率化と自動化 株式会社BLUEISH 代表取締役CEO兼CTO 為藤アキラ @AkiraTameto
為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・直近のAIプロジェクト ・画像を中心とした機械学習とLLM
のハイブリッドのアーキテクト 自己紹介
今回のお話
よくある課題 ・LLMには大量の高品質データが必要 ・手動アノテーション=時間がかかる / コストが高い / 品質 ばらつき ・「データ増やしたいけど、全然追いつかない…」
Vertex AI Data Labelingの概要 t テキスト・画像・動画などのラベル付けをクラウドで一元管7 t 手動ラベリング+自動ラベリングの両方が可能 更にAutoMLモデル活用で効率UP! Vertex
AIのラベリング機能とは?
自動アノテーションの活用方法 E4 少量のデータでAutoMLモデル作S 54 大量データに一括ラベル付A 24 人間が確認・修正 → 精度UP 自動アノテーションは大きく3ステップ
具体的なワークフロー 4% データの準備 (Cloud Storage / BigQuery など) a` ラベリングプロジェクト作成
(Vertex AIコンソール) y` 少量データのラベル付け ` AutoMLモデルの学習 k` 自動アノテーションの適用 u` 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) HY ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け 4 AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) xy 少量データのラベル付け 4 AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け 4 AutoMLモデルの学習 d 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け 4 AutoMLモデルの学習 k4 自動アノテーションの適用 uo 人間の確認・修正
メリットと課題 8 作業時間・コスト削% 8 精度と一貫性の向 8 データ増加へのスケーラビリティ メリット 8 モデル精度への依b
8 100%自動化は難しく、Human in the Loopが必y 8 初期コストの先行投資 課題
まとめ 1 W 「Vertex AI+AutoML」でラベリングを効率" W LLM開発のデータ準備をスピードアッ W People(人間) +
AI でハイブリッド運用 まとめ
Thank You!