Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
掲示板への不適切な投稿を防ぐ
Search
北村
August 23, 2025
Technology
0
150
掲示板への不適切な投稿を防ぐ
北村
August 23, 2025
Tweet
Share
More Decks by 北村
See All by 北村
LLMの出力を構造化したい
shu_kita
0
210
Azure Container Appsを使ってみた
shu_kita
0
150
ギャルのパンティおくれ
shu_kita
1
150
LSMツリー
shu_kita
0
21
正規表現エンジンを自作した話
shu_kita
0
17
Other Decks in Technology
See All in Technology
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
3k
レガシー共有バッチ基盤への挑戦 - SREドリブンなリアーキテクチャリングの取り組み
tatsukoni
0
180
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
セキュリティについて学ぶ会 / 2026 01 25 Takamatsu WordPress Meetup
rocketmartue
1
270
20260129_CB_Kansai
takuyay0ne
1
260
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
1
140
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
260
Digitization部 紹介資料
sansan33
PRO
1
6.8k
CDK対応したAWS DevOps Agentを試そう_20260201
masakiokuda
1
150
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
0gm
0
630
Embedded SREの終わりを設計する 「なんとなく」から計画的な自立支援へ
sansantech
PRO
2
1.7k
AI時代、1年目エンジニアの悩み
jin4
1
150
Featured
See All Featured
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
290
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
54
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.5k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
62
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
260
GitHub's CSS Performance
jonrohan
1032
470k
Transcript
掲示板への不適切な投稿を防ぐ (Azure AI Content Safety) shu-kita
自己紹介 • 出身 ◦ 大阪府枚方市 ◦ 3年前から札幌住み • 業務 ◦
SIer ◦ デバイスドライバ関係 • 趣味 ◦ テニス、フットサルやってます ◦ お笑いが好きです
話すこと • 掲示板アプリへの不適切な投稿を防ぐ • ついでにクソアプリができた(時間あれば)
なぜ掲示板? • Webアプリを作ったことない • クラウドもほぼ触ったことない => Web系入門で定番とされている掲示板アプリを作って、 クラウドにデプロイしてみよう。
できた
課題 課題は差別・暴言・下ネタなど何でも投稿ができること。 • 誹謗中傷 • 犯罪予告 • 性的な発言 • 差別的な発言
治安が悪い
解決策 投稿前に内容を精査して、不適切な投稿をできないようにしたい。 でも... • 何が含まれていたら不適切なの? • 程度が軽ければOK?「軽い」の基準は? • 誰が投稿内容を精査する? Azure
AI Content Safety を使って解決
Azure AI Content Safety とは アプリケーション内の「不快なコンテンツ」を検出する AI サービス。 検出対象のコンテンツはテキスト、画像。 色々機能はありますが、今回はテキストの検出機能を利用。
Content (text or image) カテゴリ レベル Hate and Fairness 0 Sexual 2 Violence 0 Self-Harm 0 Azure AI Content Safety
評価結果 評価は以下の4カテゴリから行われる。 各カテゴリで 0~7 の Severity Level(以降、レベルと記載)が付けられる。 カテゴリ 内容 Hate
and Fairness 特定の人種・地域への差別 いやがらせやイジメ Sexual ヌードやポルノなど性的な内容 Violence 脅迫、テロなど暴力的な内容 Self-Harm 自傷行為に関する内容
掲示板アプリでの活用 投稿を Content Safety に渡して評価する。 評価結果のレベルが4以上だったら、掲示板に投稿させない。 投稿 カテゴリ レベル Hate
and Fairness 0 Sexual 2 Violence 0 Self-Harm 0 Azure AI Content Safety レベルが高い場合は 掲示板に投稿させない
現実で起きたこと この機能で何ができるのか やすこを悲しませない
Content Safetyを使うと この機能で何ができるのか やすこを悲しませない 投稿させない 悲しくならない
デモ Content Safety にフワちゃんの投稿を渡してみる
AIによるチェックの難しさ 単語の意味に強く引っ張られる 印象 • 危険な単語を含むけど、問題ない表現 ◦ 以下、試してみて不適切となった ▪ 息を殺す ▪
飯テロ • 皮肉に弱い ◦ 遠回しに意地悪く嫌味を言う ▪ 面白い人だねw => バカにしている
ついでにクソアプリができた Content Safetyを色々試している中で、 京都風の嫌味を入力してみたら... • Content Safety の点数が低い • 攻撃性がある
=> これを満たせばいい嫌味。
京都人になろう AIが状況を提示してくれる。 京都人になりきって、状況にあった嫌味をいうゲーム。 Content Safety と Azure AI Foundary を組み合わせて、嫌味を評価。
私のことは嫌いでも、京都のことは嫌いにならないでください。 リンク: 京都人になろう
まとめ • Azure AI Content Safetyで「不快なコンテンツ」を検出できる。 • 試したところ、単語の意味にひっぱられがちだった。 • やすこを救える。