$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
掲示板への不適切な投稿を防ぐ
Search
北村
August 23, 2025
Technology
0
59
掲示板への不適切な投稿を防ぐ
北村
August 23, 2025
Tweet
Share
More Decks by 北村
See All by 北村
Azure Container Appsを使ってみた
shu_kita
0
53
ギャルのパンティおくれ
shu_kita
1
52
LSMツリー
shu_kita
0
18
正規表現エンジンを自作した話
shu_kita
0
15
Other Decks in Technology
See All in Technology
20251203_AIxIoTビジネス共創ラボ_第4回勉強会_BP山崎.pdf
iotcomjpadmin
0
120
S3を正しく理解するための内部構造の読解
nrinetcom
PRO
3
240
20251222_サンフランシスコサバイバル術
ponponmikankan
2
130
2025年 開発生産「可能」性向上報告 サイロ解消からチームが能動性を獲得するまで/ 20251216 Naoki Takahashi
shift_evolve
PRO
2
210
松尾研LLM講座2025 応用編Day3「軽量化」 講義資料
aratako
0
350
意外と知らない状態遷移テストの世界
nihonbuson
PRO
1
190
Agent Skillsがハーネスの垣根を超える日
gotalab555
5
3.6k
日本の AI 開発と世界の潮流 / GenAI Development in Japan
hariby
1
200
ActiveJobUpdates
igaiga
1
300
AI駆動開発の実践とその未来
eltociear
1
470
アプリにAIを正しく組み込むための アーキテクチャ── 国産LLMの現実と実践
kohju
0
190
Fashion×AI「似合う」を届けるためのWEARのAI戦略
zozotech
PRO
2
1.1k
Featured
See All Featured
The Curse of the Amulet
leimatthew05
0
4.6k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
850
Digital Ethics as a Driver of Design Innovation
axbom
PRO
0
130
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Automating Front-end Workflow
addyosmani
1371
200k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
31
Google's AI Overviews - The New Search
badams
0
870
Agile that works and the tools we love
rasmusluckow
331
21k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
190
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
Transcript
掲示板への不適切な投稿を防ぐ (Azure AI Content Safety) shu-kita
自己紹介 • 出身 ◦ 大阪府枚方市 ◦ 3年前から札幌住み • 業務 ◦
SIer ◦ デバイスドライバ関係 • 趣味 ◦ テニス、フットサルやってます ◦ お笑いが好きです
話すこと • 掲示板アプリへの不適切な投稿を防ぐ • ついでにクソアプリができた(時間あれば)
なぜ掲示板? • Webアプリを作ったことない • クラウドもほぼ触ったことない => Web系入門で定番とされている掲示板アプリを作って、 クラウドにデプロイしてみよう。
できた
課題 課題は差別・暴言・下ネタなど何でも投稿ができること。 • 誹謗中傷 • 犯罪予告 • 性的な発言 • 差別的な発言
治安が悪い
解決策 投稿前に内容を精査して、不適切な投稿をできないようにしたい。 でも... • 何が含まれていたら不適切なの? • 程度が軽ければOK?「軽い」の基準は? • 誰が投稿内容を精査する? Azure
AI Content Safety を使って解決
Azure AI Content Safety とは アプリケーション内の「不快なコンテンツ」を検出する AI サービス。 検出対象のコンテンツはテキスト、画像。 色々機能はありますが、今回はテキストの検出機能を利用。
Content (text or image) カテゴリ レベル Hate and Fairness 0 Sexual 2 Violence 0 Self-Harm 0 Azure AI Content Safety
評価結果 評価は以下の4カテゴリから行われる。 各カテゴリで 0~7 の Severity Level(以降、レベルと記載)が付けられる。 カテゴリ 内容 Hate
and Fairness 特定の人種・地域への差別 いやがらせやイジメ Sexual ヌードやポルノなど性的な内容 Violence 脅迫、テロなど暴力的な内容 Self-Harm 自傷行為に関する内容
掲示板アプリでの活用 投稿を Content Safety に渡して評価する。 評価結果のレベルが4以上だったら、掲示板に投稿させない。 投稿 カテゴリ レベル Hate
and Fairness 0 Sexual 2 Violence 0 Self-Harm 0 Azure AI Content Safety レベルが高い場合は 掲示板に投稿させない
現実で起きたこと この機能で何ができるのか やすこを悲しませない
Content Safetyを使うと この機能で何ができるのか やすこを悲しませない 投稿させない 悲しくならない
デモ Content Safety にフワちゃんの投稿を渡してみる
AIによるチェックの難しさ 単語の意味に強く引っ張られる 印象 • 危険な単語を含むけど、問題ない表現 ◦ 以下、試してみて不適切となった ▪ 息を殺す ▪
飯テロ • 皮肉に弱い ◦ 遠回しに意地悪く嫌味を言う ▪ 面白い人だねw => バカにしている
ついでにクソアプリができた Content Safetyを色々試している中で、 京都風の嫌味を入力してみたら... • Content Safety の点数が低い • 攻撃性がある
=> これを満たせばいい嫌味。
京都人になろう AIが状況を提示してくれる。 京都人になりきって、状況にあった嫌味をいうゲーム。 Content Safety と Azure AI Foundary を組み合わせて、嫌味を評価。
私のことは嫌いでも、京都のことは嫌いにならないでください。 リンク: 京都人になろう
まとめ • Azure AI Content Safetyで「不快なコンテンツ」を検出できる。 • 試したところ、単語の意味にひっぱられがちだった。 • やすこを救える。