Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
Search
為藤アキラ
February 06, 2025
Technology
0
120
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
為藤アキラ
February 06, 2025
Tweet
Share
More Decks by 為藤アキラ
See All by 為藤アキラ
AI Agent Vertex AI Agent Builder × A2A × ADKで繋げるマルチエージェント
akiratameto
1
92
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレールで守る安全なAI運用
akiratameto
2
260
Amazon Bedrockで実現する堅牢なデータエンジニアリング
akiratameto
1
68
Bedrock カスタムモデルvs汎用モデルの比較
akiratameto
1
120
Amazon Bedrock Agents (ナレッジベースの種類)
akiratameto
1
200
DeepSeek-R1をカスタムモデルとしてAmazon Bedrockにインポートし活用
akiratameto
0
210
Amazon Bedrock Agents (基本編)
akiratameto
0
180
SageMaker Feature Storeを活かしたLLM推論
akiratameto
1
67
Other Decks in Technology
See All in Technology
ここ一年のCCoEとしてのAWSコスト最適化を振り返る / CCoE AWS Cost Optimization devio2025
masahirokawahara
1
1.5k
Platform開発が先行する Platform Engineeringの違和感
kintotechdev
2
430
[ JAWS-UG 東京 CommunityBuilders Night #2 ]SlackとAmazon Q Developerで 運用効率化を模索する
sh_fk2
1
150
サンドボックス技術でAI利活用を促進する
koh_naga
0
190
allow_retry と Arel.sql / allow_retry and Arel.sql
euglena1215
1
150
2025年にHCP Vaultを学び直して見えた景色 / Lessons and New Perspectives from Relearning HCP Vault in 2025
aeonpeople
0
200
複数サービスを支えるマルチテナント型Batch MLプラットフォーム
lycorptech_jp
PRO
0
200
BPaaSにおける人と協働する前提のAIエージェント-AWS登壇資料
kentarofujii
0
120
AWSで始める実践Dagster入門
kitagawaz
0
300
La gouvernance territoriale des données grâce à la plateforme Terreze
bluehats
0
110
「魔法少女まどか☆マギカ Magia Exedra」のグローバル展開を支える、開発チームと翻訳チームの「意識しない協創」を実現するローカライズシステム
gree_tech
PRO
0
560
バッチ処理で悩むバックエンドエンジニアに捧げるAWS Glue入門
diggymo
3
120
Featured
See All Featured
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Scaling GitHub
holman
463
140k
How to train your dragon (web standard)
notwaldorf
96
6.2k
The Cost Of JavaScript in 2023
addyosmani
53
8.9k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
910
Making the Leap to Tech Lead
cromwellryan
135
9.5k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
KATA
mclloyd
32
14k
Done Done
chrislema
185
16k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
111
20k
Code Reviewing Like a Champion
maltzj
525
40k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Transcript
Google Cloud活用 AI/ML/LLM #1 機械学習 (ML) / 大規模言語モデル(LLM) の為のデータ準備 Vertex
AIで実現するLLMデータ アノテーションの効率化と自動化 株式会社BLUEISH 代表取締役CEO兼CTO 為藤アキラ @AkiraTameto
為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・直近のAIプロジェクト ・画像を中心とした機械学習とLLM
のハイブリッドのアーキテクト 自己紹介
今回のお話
よくある課題 ・LLMには大量の高品質データが必要 ・手動アノテーション=時間がかかる / コストが高い / 品質 ばらつき ・「データ増やしたいけど、全然追いつかない…」
Vertex AI Data Labelingの概要 t テキスト・画像・動画などのラベル付けをクラウドで一元管7 t 手動ラベリング+自動ラベリングの両方が可能 更にAutoMLモデル活用で効率UP! Vertex
AIのラベリング機能とは?
自動アノテーションの活用方法 E4 少量のデータでAutoMLモデル作S 54 大量データに一括ラベル付A 24 人間が確認・修正 → 精度UP 自動アノテーションは大きく3ステップ
具体的なワークフロー 4% データの準備 (Cloud Storage / BigQuery など) a` ラベリングプロジェクト作成
(Vertex AIコンソール) y` 少量データのラベル付け ` AutoMLモデルの学習 k` 自動アノテーションの適用 u` 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) HY ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け 4 AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) xy 少量データのラベル付け 4 AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け 4 AutoMLモデルの学習 d 自動アノテーションの適用 u4 人間の確認・修正
具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成
(Vertex AIコンソール) y4 少量データのラベル付け 4 AutoMLモデルの学習 k4 自動アノテーションの適用 uo 人間の確認・修正
メリットと課題 8 作業時間・コスト削% 8 精度と一貫性の向 8 データ増加へのスケーラビリティ メリット 8 モデル精度への依b
8 100%自動化は難しく、Human in the Loopが必y 8 初期コストの先行投資 課題
まとめ 1 W 「Vertex AI+AutoML」でラベリングを効率" W LLM開発のデータ準備をスピードアッ W People(人間) +
AI でハイブリッド運用 まとめ
Thank You!