Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実は簡単!? AIを攻撃してみよう
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Kotokaze
November 29, 2020
Technology
380
0
Share
実は簡単!? AIを攻撃してみよう
Kotokaze
November 29, 2020
More Decks by Kotokaze
See All by Kotokaze
Stack&Heep
kotokaze
0
86
Introduction to Git & GitHub
kotokaze
0
230
ファイルレスマルウェアの実態と対策
kotokaze
1
500
Other Decks in Technology
See All in Technology
まだ道半ば、AI-DLCを歩み始めている話
news_it_enj
2
200
責任あるソフトウェアエンジニアリングの紹介4章・5章 / RSE_Ch4-5
ido_kara_deru
0
350
【ハノーバーメッセ振り返りイベントat名古屋】データは集約からAI起点の収集に ~組織内・組織間でのデータ連携~
tanakaseiya
0
130
AI時代から振り返るTerraform drift運用の歴史 / AI Age Reflections on the History of Terraform Drift Operations
aeonpeople
0
540
ポスター発表&デモと総括 / Poster Presentations & Demonstrations and Summary
ks91
PRO
0
150
『家族アルバム みてね』における インシデント対応との向き合い方 / Approach incident response in Family Album
kohbis
2
240
データ基盤構築・運用の現場から 〜 Snowflake Intelligence 導入で変わった、データ活用の未来 〜
wonohe
0
210
DI コンテナ自動生成ツールを実装してみた / intro-autodi
uhzz
0
870
JJUG CCC 2026 Spring AI時代の開発こそ標準化を武器に! ― 方式・プロセス・プラットフォームの標準化
s27watanabe
2
540
最低限これだけ押さえれ大丈夫_Claude Enterprise/Team企業展開ガバナンス入門
tkikuchi
1
330
イベントストーミングとKiroの仕様駆動開発で実現する要件の認識合わせプロセス
syobochim
7
820
Amazon Bedrock 経由の Claude Cowork を試してみよう・MCP にも繋いでみよう
sugimomoto
0
220
Featured
See All Featured
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
200
4 Signs Your Business is Dying
shpigford
187
22k
Automating Front-end Workflow
addyosmani
1370
210k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Skip the Path - Find Your Career Trail
mkilby
1
130
AI: The stuff that nobody shows you
jnunemaker
PRO
7
660
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
370
A Modern Web Designer's Workflow
chriscoyier
698
190k
Claude Code のすすめ
schroneko
67
220k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
390
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
180
Transcript
実は簡単!? AIを攻撃してみよう KOTOKAZE
この違いは?というお話です 出典: https://arxiv.org/pdf/1707.07397.pdf 亀を ジグソーパズル と分類している
そもそもAIって? 学習 推論 認識 記憶 の4つをコンピュータ上で行うもの
AI の分類 人工知能 機械学習 (ML) 深層学習 (DL) ML • 要設定
DL • 自動チューニング
機械学習 (ML) の分類 機械学習 教師あり • 分類 • 回帰 教師なし
強化学習
教師あり学習 分類 学習データ 判定したいもの 回帰 今後の 課金額 予測 年齢 性別
過去の 課金額 ログイン 日数 平均 ログイン 時間 ラベリング済み画像 出典: http://www.cs.toronto.edu/~kriz/cifar.html
教師なし学習: データの自動分類 0 0.5 1 1.5 2 2.5 3 3.5
0 0.5 1 1.5 2 2.5 3
強化学習 環境 エージェント ① 状態 ② 行動 ③ 報酬
モデルへの攻撃の余地 学習データの 収集・作成 モデルの学習 推論 学習データ汚染 学習モデル汚染 クエリ
画像分類器 (CNN) の学習の仕組み 出典: https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html 猫: 98.3% 熊: 0.14% 猫の確率が上がるよう
ウェイトを調整
敵対的サンプル (Adversarial Examples) 出典: http://www.iro.umontreal.ca/~memisevr/dlss2015/goodfellow_adv.pdf
AEs 攻撃の仕組み 出典: https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html 猫: 5.14% 熊: 99.2% 上から重ねる 摂動を調整
学習済みなので ウェイトは不変