Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Rekognitionのカスタムモデルで独自のモデレーションモデルをトレーニングする
Search
Nayuta S.
November 13, 2024
Technology
0
240
Amazon Rekognitionのカスタムモデルで独自のモデレーションモデルをトレーニングする
まるクラ勉強会 ONLINE #3で発表した資料になります。
https://classmethod.connpass.com/event/333509/
Nayuta S.
November 13, 2024
Tweet
Share
More Decks by Nayuta S.
See All by Nayuta S.
FastMCPでSQLをチェックしてくれるMCPサーバーを自作してCursorから動かしてみた
nayuts
1
320
Amazon Athenaから利用時のGlueのIcebergテーブルのメンテナンスについて
nayuts
0
330
目玉アップデート!のSageMaker LakehouseとUnified Studioは何たるかを見てみよう!
nayuts
0
940
Google CloudのLLM活用の選択肢を広げるVertex AIのパートナーモデル
nayuts
0
440
データ品質管理の第一歩
nayuts
1
940
簡単に始めるSnowflakeの機械学習
nayuts
1
1.3k
AthenaとStep Functionsで簡単ETLオーケストレーション #midosuji_tech
nayuts
1
1.2k
Vertex AIとBigQueryでつくる簡単ベクトル検索&テキスト分析システム
nayuts
0
1.1k
AIが強力にサポート!データ分析・ML系サービスアップデート
nayuts
0
740
Other Decks in Technology
See All in Technology
AWS CDK 実践的アプローチ N選 / aws-cdk-practical-approaches
gotok365
4
260
Claude Code Actionを使ったコード品質改善の取り組み
potix2
PRO
0
130
自分を理解するAI時代の準備 〜マイプロフィールMCPの実装〜
edo_m18
0
110
Amazon Bedrockで実現する 新たな学習体験
kzkmaeda
1
220
DroidKnights 2025 - Jetpack XR 살펴보기: XR 개발은 어떻게 이루어지는가?
heesung6701
1
160
Amazon S3標準/ S3 Tables/S3 Express One Zoneを使ったログ分析
shigeruoda
1
150
VISITS_AIIoTビジネス共創ラボ登壇資料.pdf
iotcomjpadmin
0
140
(非公式) AWS Summit Japan と 海浜幕張 の歩き方 2025年版
coosuke
PRO
1
320
25分で解説する「最小権限の原則」を実現するための AWS「ポリシー」大全 / 20250625-aws-summit-aws-policy
opelab
5
460
Uniadex__公開版_20250617-AIxIoTビジネス共創ラボ_ツナガルチカラ_.pdf
iotcomjpadmin
0
140
Observability в PHP без боли. Олег Мифле, тимлид Altenar
lamodatech
0
230
AIのAIによるAIのための出力評価と改善
chocoyama
0
390
Featured
See All Featured
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.8k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.8k
Into the Great Unknown - MozCon
thekraken
39
1.8k
Making the Leap to Tech Lead
cromwellryan
134
9.3k
Balancing Empowerment & Direction
lara
1
330
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
GitHub's CSS Performance
jonrohan
1031
460k
Code Reviewing Like a Champion
maltzj
524
40k
Rails Girls Zürich Keynote
gr2m
94
14k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
32
5.9k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
The Language of Interfaces
destraynor
158
25k
Transcript
2024/11/13 データ事業本部 鈴木那由太 まるクラ勉強会 O N L IN E #3
A m a z on R ekog nitionのカスタムモデルで 独自のモデレーションモデルをトレーニングする
目次 2 • コンテンツモデレーションについて • A m az on R
e kog nitionについて • R e kog nitionのカスタムモデレーションの紹介
自己紹介 3 名前:鈴木 那由太(スズキ ナユタ) 所属:クラスメソッド株式会社 データ事業本部 インテグレーション部 機械学習チーム 現在の業務:
機械学習用途のデータ分析基盤構築 機械学習システム構築 X:@nayuyu_ns Osaka
コンテンツモデレーションについて
コンテンツモデレーションについて 5 • ユーザーがコンテンツを作成できるウェブサイトで、無関係・わいせつ・違法・有害・侮辱的な投稿を検出する プロセス • 問題のあるコンテンツに対して削除または警告ラベルを適用し、ユーザーが自分でコンテンツをブロックおよび フィルタリングできるようにすることが目的 • 例:動画配信サービスで再生開始時に警告ラベルが出る
AWSでコンテンツモデレーションをするには 6 必ずしもAmazon Rekognitionのコンテンツモデレーションを使う必要はない • 規制したいシチュエーションの画像・動画 • Rekognitionのコンテンツモデレーションで対応可能 • キャラクターやロゴなど著作権侵害の検出
• 特定の対象であればRekognitionのカスタムラベルで対応可能 • マルチモーダルなLLM • 不適切なテキスト • Amazon Comprehend toxicity detectionによる分析(英語のみ) • Amazon Translate Masking profane機能による、翻訳対象中の不適切な単語のマスク • LLMによる判定 Amazon Web Services ブログ『Amazon Rekognition のカスタムモデレーションを利用して独自のモデルで不適切なコンテンツを検出』を参考 • https://aws.amazon.com/jp/blogs/news/amazon-rekognition-のカスタムモデレーションを利用して独自の/
LLMによる画像のモデレーションの検証 7 最近ではマルチモーダルなLLMが登場しており、テキストだけでなく画像などに対しても抽象的な モデレーションができつつある。 ただし、ハルシネーションや再現性の課題はある。 Developers IOブログ『生成AI(Claude 3.5 Sonnet)を使って、画像のモデレーションが可能かどうかを検証してみた』を参考 •
https://dev.classmethod.jp/articles/character-spot-the-difference/ Amazon BedrockからClaude 3.5 Sonnetを利用した例:
Amazon Rekognitionについて
Amazon Rekognitionについて 9 • 画像認識・動画処理向けのAWSのマネージドサービス • 多岐にわたる分析ができる • 顔画像のマッチング •
顔画像の検索 • ラベル検出 • モデレーション(有害性の検出) • 顔の検出と分析 • 画像中のテキスト検出 • 有名人の認識 • 個人用防護具 (PPE) 検出 • 画像のプロパティ分析
Amazon Rekognitionのコンテンツモデレーション 10 • 画像・動画を入力に、警告ラベルをつけてくれる機能 • 現在は、第3レベルカテゴリ粒度で34種 • どちらかというと商品画像などに適しているような所感 <検出の例>
<ラベルのカテゴリの例> • アルコール(L1 – トップレベルカテゴリ) • アルコールの使用(L2 – 第2レベルカテゴリ) • 飲酒(L3 – 第3レベルカテゴリ) • アルコール飲料(L2) ※いらすとやより
Amazon Rekognitionのカスタムモデレーション 11 • “アダプター”を訓練することにより、デフォルトのコンテンツモデレーション機能をカスタマイズできる • 新たな不適切なラベルを追加するのではなく、既存のラベルに割り当てられない画像を、 既存ラベルに判定できるようにする機能 ※Amazon Rekognitionのコンソールより
カスタムモデレーションのご紹介
問題設定 13 自社のECサイトで、高級ワインの取引が行われており、配送時に破損するなどトラブルが多発している。 そもそも酒類の取引は認めておらず、アルコールに関するアイキャッチを設定できないように コンテンツモデレーション機能でブロックしているが、高級ワインを表す画像としてレーズンの画像が 使われるケースがあり、知らないうちに販売が続いていた。 レーズンの画像もアルコールとしてラベル付けしたい。 <問題の画像のサンプル>
画像の用意 14 偽陰性サンプル(50枚) • トレーニング: • 最低 50 個の偽陰性サンプル、または 20
個の偽陽性サンプル • 正しい予測が出る画像 • テスト: • 最低 20 個のサンプル 正しい予測が出る画像(10枚) 正しい予測が出る画像(10枚)
ラベル付け 15 • Amazon Rekognitionのプロジェクト画面上からできる • 陰性のサンプルにはSafeを付ける • 陽性のサンプルには該当するラベルを付ける <ラベル付けの例>
トレーニング 16 • ラベル付け後に、プロジェクト画面からアダプターのトレーニングを実行できる • 通常は30分〜2時間
アダプターの評価 17 • しきい値を変えることで、テスト用のプロジェクト内のサンプルに対してパフォーマンス評価ができる • モデレーション実行時はアダプターとしきい値を指定して実行する
まとめ 18 • Amazon Rekognitionのカスタムモデレーションを使うことで、デフォルトでは判定されない画像に対しても、 ラベルカテゴリを割り当てることができる • ラベル付けなど一連の作業はコンソールより実施できる • 画像や動画に対してモデレーション用のラベルを割り当てる機能のため、特定のオブジェクトの検出はカスタムラベル、
より抽象的な指示はマルチモーダルLLMと、用途に応じたサービスを利用した方がより良い場合がある
None