Slide 14
Slide 14 text
データ品質担保の効率化
Human-in-the-loop
なプロセス管理を中心として効率化の余地がある
1.
データ収集・検証
○ データ作成の効率化: データの条件検索
,
半自動ラベリング
,
アノテーションツール
, …
○ データ検証の効率化:
(
擬
)
重複判定
,
匿名化
,
層化抽出
,
クラスタリング
, …
2.
モデル検証
○ アノテーション支援機能の流用
■ モデル適用状況、データレビュー状況を管理するシステム内機能
3.
モデル性能監視
○ 統計値ベースのドリフト検知や、データサンプル込みの
logging
■
Amazon SageMaker Model Monitor
や
Vertex AI Model Monitoring
等を意識