Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Rekognitionのカスタムモデルで独自のモデレーションモデルをトレーニングする
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Nayuta S.
November 13, 2024
Technology
450
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon Rekognitionのカスタムモデルで独自のモデレーションモデルをトレーニングする
まるクラ勉強会 ONLINE #3で発表した資料になります。
https://classmethod.connpass.com/event/333509/
Nayuta S.
November 13, 2024
More Decks by Nayuta S.
See All by Nayuta S.
今年注目する!データ分析プラットフォームでのAIの活用
nayuts
0
200
AIを活用したStreamlitアプリ開発のTipsと、ほかのAI機能との棲み分け
nayuts
0
650
今年のデータ・ML系アップデートと気になるアプデのご紹介
nayuts
1
2k
Snowflakeで実践する、生成AIを活用した「自然言語によるデータとの対話」
nayuts
0
550
Snowflakeの生成AI機能を活用したデータ分析アプリの作成 〜Cortex AnalystとCortex Searchの活用とStreamlitアプリでの利用〜
nayuts
1
1.7k
FastMCPでSQLをチェックしてくれるMCPサーバーを自作してCursorから動かしてみた
nayuts
1
790
Amazon Athenaから利用時のGlueのIcebergテーブルのメンテナンスについて
nayuts
0
790
目玉アップデート!のSageMaker LakehouseとUnified Studioは何たるかを見てみよう!
nayuts
0
1.5k
Google CloudのLLM活用の選択肢を広げるVertex AIのパートナーモデル
nayuts
0
720
Other Decks in Technology
See All in Technology
MCP Appsを作ってみよう
iwamot
PRO
4
570
失敗を資産に変えるClaude Code
shinyasaita
0
610
protovalidate-es を導入してみた
bengo4com
0
180
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
110
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
210
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
340
小さく始める AI 活用推進 ― 日経電子版 Web チームの事例/nikkei-tech-talk47
nikkei_engineer_recruiting
0
250
Claude Codeをどのように キャッチアップしているか
oikon48
12
7.2k
非エンジニアがClaudeと挑んだ「1ヶ月間プロダクト30本ノック」
askokc
0
420
小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ / Starting Small with SLI/SLOs: Building Adoption Through Continuous Growth
nari_ex
7
1.9k
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
630
「エンジニア進化論」2028年の開発完全自動化、エンジニアはどう進化するか
cyberagentdevelopers
PRO
6
4.9k
Featured
See All Featured
We Are The Robots
honzajavorek
0
240
Design in an AI World
tapps
1
240
Building Applications with DynamoDB
mza
96
7.1k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
210
The browser strikes back
jonoalderson
0
1.2k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
470
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
570
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
230
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.4k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
Transcript
2024/11/13 データ事業本部 鈴木那由太 まるクラ勉強会 O N L IN E #3
A m a z on R ekog nitionのカスタムモデルで 独自のモデレーションモデルをトレーニングする
目次 2 • コンテンツモデレーションについて • A m az on R
e kog nitionについて • R e kog nitionのカスタムモデレーションの紹介
自己紹介 3 名前:鈴木 那由太(スズキ ナユタ) 所属:クラスメソッド株式会社 データ事業本部 インテグレーション部 機械学習チーム 現在の業務:
機械学習用途のデータ分析基盤構築 機械学習システム構築 X:@nayuyu_ns Osaka
コンテンツモデレーションについて
コンテンツモデレーションについて 5 • ユーザーがコンテンツを作成できるウェブサイトで、無関係・わいせつ・違法・有害・侮辱的な投稿を検出する プロセス • 問題のあるコンテンツに対して削除または警告ラベルを適用し、ユーザーが自分でコンテンツをブロックおよび フィルタリングできるようにすることが目的 • 例:動画配信サービスで再生開始時に警告ラベルが出る
AWSでコンテンツモデレーションをするには 6 必ずしもAmazon Rekognitionのコンテンツモデレーションを使う必要はない • 規制したいシチュエーションの画像・動画 • Rekognitionのコンテンツモデレーションで対応可能 • キャラクターやロゴなど著作権侵害の検出
• 特定の対象であればRekognitionのカスタムラベルで対応可能 • マルチモーダルなLLM • 不適切なテキスト • Amazon Comprehend toxicity detectionによる分析(英語のみ) • Amazon Translate Masking profane機能による、翻訳対象中の不適切な単語のマスク • LLMによる判定 Amazon Web Services ブログ『Amazon Rekognition のカスタムモデレーションを利用して独自のモデルで不適切なコンテンツを検出』を参考 • https://aws.amazon.com/jp/blogs/news/amazon-rekognition-のカスタムモデレーションを利用して独自の/
LLMによる画像のモデレーションの検証 7 最近ではマルチモーダルなLLMが登場しており、テキストだけでなく画像などに対しても抽象的な モデレーションができつつある。 ただし、ハルシネーションや再現性の課題はある。 Developers IOブログ『生成AI(Claude 3.5 Sonnet)を使って、画像のモデレーションが可能かどうかを検証してみた』を参考 •
https://dev.classmethod.jp/articles/character-spot-the-difference/ Amazon BedrockからClaude 3.5 Sonnetを利用した例:
Amazon Rekognitionについて
Amazon Rekognitionについて 9 • 画像認識・動画処理向けのAWSのマネージドサービス • 多岐にわたる分析ができる • 顔画像のマッチング •
顔画像の検索 • ラベル検出 • モデレーション(有害性の検出) • 顔の検出と分析 • 画像中のテキスト検出 • 有名人の認識 • 個人用防護具 (PPE) 検出 • 画像のプロパティ分析
Amazon Rekognitionのコンテンツモデレーション 10 • 画像・動画を入力に、警告ラベルをつけてくれる機能 • 現在は、第3レベルカテゴリ粒度で34種 • どちらかというと商品画像などに適しているような所感 <検出の例>
<ラベルのカテゴリの例> • アルコール(L1 – トップレベルカテゴリ) • アルコールの使用(L2 – 第2レベルカテゴリ) • 飲酒(L3 – 第3レベルカテゴリ) • アルコール飲料(L2) ※いらすとやより
Amazon Rekognitionのカスタムモデレーション 11 • “アダプター”を訓練することにより、デフォルトのコンテンツモデレーション機能をカスタマイズできる • 新たな不適切なラベルを追加するのではなく、既存のラベルに割り当てられない画像を、 既存ラベルに判定できるようにする機能 ※Amazon Rekognitionのコンソールより
カスタムモデレーションのご紹介
問題設定 13 自社のECサイトで、高級ワインの取引が行われており、配送時に破損するなどトラブルが多発している。 そもそも酒類の取引は認めておらず、アルコールに関するアイキャッチを設定できないように コンテンツモデレーション機能でブロックしているが、高級ワインを表す画像としてレーズンの画像が 使われるケースがあり、知らないうちに販売が続いていた。 レーズンの画像もアルコールとしてラベル付けしたい。 <問題の画像のサンプル>
画像の用意 14 偽陰性サンプル(50枚) • トレーニング: • 最低 50 個の偽陰性サンプル、または 20
個の偽陽性サンプル • 正しい予測が出る画像 • テスト: • 最低 20 個のサンプル 正しい予測が出る画像(10枚) 正しい予測が出る画像(10枚)
ラベル付け 15 • Amazon Rekognitionのプロジェクト画面上からできる • 陰性のサンプルにはSafeを付ける • 陽性のサンプルには該当するラベルを付ける <ラベル付けの例>
トレーニング 16 • ラベル付け後に、プロジェクト画面からアダプターのトレーニングを実行できる • 通常は30分〜2時間
アダプターの評価 17 • しきい値を変えることで、テスト用のプロジェクト内のサンプルに対してパフォーマンス評価ができる • モデレーション実行時はアダプターとしきい値を指定して実行する
まとめ 18 • Amazon Rekognitionのカスタムモデレーションを使うことで、デフォルトでは判定されない画像に対しても、 ラベルカテゴリを割り当てることができる • ラベル付けなど一連の作業はコンソールより実施できる • 画像や動画に対してモデレーション用のラベルを割り当てる機能のため、特定のオブジェクトの検出はカスタムラベル、
より抽象的な指示はマルチモーダルLLMと、用途に応じたサービスを利用した方がより良い場合がある
None