Slide 1

Slide 1 text

Google Cloud活用 AI/ML/LLM #1 機械学習 (ML) / 大規模言語モデル(LLM) の為のデータ準備 Vertex AIで実現するLLMデータ アノテーションの効率化と自動化 株式会社BLUEISH 代表取締役CEO兼CTO 為藤アキラ @AkiraTameto

Slide 2

Slide 2 text

為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・直近のAIプロジェクト   ・画像を中心とした機械学習とLLM のハイブリッドのアーキテクト 自己紹介

Slide 3

Slide 3 text

今回のお話

Slide 4

Slide 4 text

よくある課題 ・LLMには大量の高品質データが必要 ・手動アノテーション=時間がかかる / コストが高い / 品質 ばらつき ・「データ増やしたいけど、全然追いつかない…」

Slide 5

Slide 5 text

Vertex AI Data Labelingの概要 t テキスト・画像・動画などのラベル付けをクラウドで一元管7 t 手動ラベリング+自動ラベリングの両方が可能 更にAutoMLモデル活用で効率UP! Vertex AIのラベリング機能とは?

Slide 6

Slide 6 text

自動アノテーションの活用方法 E4 少量のデータでAutoMLモデル作S 54 大量データに一括ラベル付A 24 人間が確認・修正 → 精度UP 自動アノテーションは大きく3ステップ

Slide 7

Slide 7 text

具体的なワークフロー 4% データの準備 (Cloud Storage / BigQuery など) a` ラベリングプロジェクト作成 (Vertex AIコンソール) y` 少量データのラベル付け “` AutoMLモデルの学習 k` 自動アノテーションの適用 u` 人間の確認・修正

Slide 8

Slide 8 text

具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) HY ラベリングプロジェクト作成 (Vertex AIコンソール) y4 少量データのラベル付け “4 AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正

Slide 9

Slide 9 text

具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成 (Vertex AIコンソール) xy 少量データのラベル付け “4 AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正

Slide 10

Slide 10 text

具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成 (Vertex AIコンソール) y4 少量データのラベル付け “’ AutoMLモデルの学習 k4 自動アノテーションの適用 u4 人間の確認・修正

Slide 11

Slide 11 text

具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成 (Vertex AIコンソール) y4 少量データのラベル付け “4 AutoMLモデルの学習 d˜ 自動アノテーションの適用 u4 人間の確認・修正

Slide 12

Slide 12 text

具体的なワークフロー 74 データの準備 (Cloud Storage / BigQuery など) a4 ラベリングプロジェクト作成 (Vertex AIコンソール) y4 少量データのラベル付け “4 AutoMLモデルの学習 k4 自動アノテーションの適用 uo 人間の確認・修正

Slide 13

Slide 13 text

メリットと課題 8 作業時間・コスト削% 8 精度と一貫性の向 8 データ増加へのスケーラビリティ メリット 8 モデル精度への依b 8 100%自動化は難しく、Human in the Loopが必y 8 初期コストの先行投資 課題

Slide 14

Slide 14 text

まとめ 1 W 「Vertex AI+AutoML」でラベリングを効率" W LLM開発のデータ準備をスピードアッ W People(人間) + AI でハイブリッド運用 ⁨ ⁩ まとめ

Slide 15

Slide 15 text

Thank You!