Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
掲示板への不適切な投稿を防ぐ
Search
北村
August 23, 2025
Technology
0
180
掲示板への不適切な投稿を防ぐ
北村
August 23, 2025
Tweet
Share
More Decks by 北村
See All by 北村
LLMの出力を構造化したい
shu_kita
0
250
Azure Container Appsを使ってみた
shu_kita
0
180
ギャルのパンティおくれ
shu_kita
1
170
LSMツリー
shu_kita
0
21
正規表現エンジンを自作した話
shu_kita
0
17
Other Decks in Technology
See All in Technology
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
har1101
0
340
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
Embedded SREの終わりを設計する 「なんとなく」から計画的な自立支援へ
sansantech
PRO
3
2.6k
Claude Code for NOT Programming
kawaguti
PRO
1
110
Ruby版 JSXのRuxが気になる
sansantech
PRO
0
170
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
220
データの整合性を保ちたいだけなんだ
shoheimitani
8
3.2k
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
270
SREが向き合う大規模リアーキテクチャ 〜信頼性とアジリティの両立〜
zepprix
0
480
Exadata Fleet Update
oracle4engineer
PRO
0
1.1k
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
340
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
3
1.1k
Featured
See All Featured
Fireside Chat
paigeccino
41
3.8k
Thoughts on Productivity
jonyablonski
74
5k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
0
260
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
1
58
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
330
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
57
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
440
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
300
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
57
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Transcript
掲示板への不適切な投稿を防ぐ (Azure AI Content Safety) shu-kita
自己紹介 • 出身 ◦ 大阪府枚方市 ◦ 3年前から札幌住み • 業務 ◦
SIer ◦ デバイスドライバ関係 • 趣味 ◦ テニス、フットサルやってます ◦ お笑いが好きです
話すこと • 掲示板アプリへの不適切な投稿を防ぐ • ついでにクソアプリができた(時間あれば)
なぜ掲示板? • Webアプリを作ったことない • クラウドもほぼ触ったことない => Web系入門で定番とされている掲示板アプリを作って、 クラウドにデプロイしてみよう。
できた
課題 課題は差別・暴言・下ネタなど何でも投稿ができること。 • 誹謗中傷 • 犯罪予告 • 性的な発言 • 差別的な発言
治安が悪い
解決策 投稿前に内容を精査して、不適切な投稿をできないようにしたい。 でも... • 何が含まれていたら不適切なの? • 程度が軽ければOK?「軽い」の基準は? • 誰が投稿内容を精査する? Azure
AI Content Safety を使って解決
Azure AI Content Safety とは アプリケーション内の「不快なコンテンツ」を検出する AI サービス。 検出対象のコンテンツはテキスト、画像。 色々機能はありますが、今回はテキストの検出機能を利用。
Content (text or image) カテゴリ レベル Hate and Fairness 0 Sexual 2 Violence 0 Self-Harm 0 Azure AI Content Safety
評価結果 評価は以下の4カテゴリから行われる。 各カテゴリで 0~7 の Severity Level(以降、レベルと記載)が付けられる。 カテゴリ 内容 Hate
and Fairness 特定の人種・地域への差別 いやがらせやイジメ Sexual ヌードやポルノなど性的な内容 Violence 脅迫、テロなど暴力的な内容 Self-Harm 自傷行為に関する内容
掲示板アプリでの活用 投稿を Content Safety に渡して評価する。 評価結果のレベルが4以上だったら、掲示板に投稿させない。 投稿 カテゴリ レベル Hate
and Fairness 0 Sexual 2 Violence 0 Self-Harm 0 Azure AI Content Safety レベルが高い場合は 掲示板に投稿させない
現実で起きたこと この機能で何ができるのか やすこを悲しませない
Content Safetyを使うと この機能で何ができるのか やすこを悲しませない 投稿させない 悲しくならない
デモ Content Safety にフワちゃんの投稿を渡してみる
AIによるチェックの難しさ 単語の意味に強く引っ張られる 印象 • 危険な単語を含むけど、問題ない表現 ◦ 以下、試してみて不適切となった ▪ 息を殺す ▪
飯テロ • 皮肉に弱い ◦ 遠回しに意地悪く嫌味を言う ▪ 面白い人だねw => バカにしている
ついでにクソアプリができた Content Safetyを色々試している中で、 京都風の嫌味を入力してみたら... • Content Safety の点数が低い • 攻撃性がある
=> これを満たせばいい嫌味。
京都人になろう AIが状況を提示してくれる。 京都人になりきって、状況にあった嫌味をいうゲーム。 Content Safety と Azure AI Foundary を組み合わせて、嫌味を評価。
私のことは嫌いでも、京都のことは嫌いにならないでください。 リンク: 京都人になろう
まとめ • Azure AI Content Safetyで「不快なコンテンツ」を検出できる。 • 試したところ、単語の意味にひっぱられがちだった。 • やすこを救える。