Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実は簡単!? AIを攻撃してみよう
Search
Kotokaze
November 29, 2020
Technology
0
340
実は簡単!? AIを攻撃してみよう
Kotokaze
November 29, 2020
Tweet
Share
More Decks by Kotokaze
See All by Kotokaze
Stack&Heep
kotokaze
0
78
Introduction to Git & GitHub
kotokaze
0
210
ファイルレスマルウェアの実態と対策
kotokaze
1
370
Other Decks in Technology
See All in Technology
Googleマップ/Earthが一般化した 地図タイルのイマ
mapconcierge4agu
1
200
ホワイトボードチャレンジ 説明&実行資料
ichimichi
0
120
技術負債の「予兆検知」と「状況異変」のススメ / Technology Dept
i35_267
1
1k
Postmanを使いこなす!2025年ぜひとも押さえておきたいPostmanの10の機能
nagix
2
140
Larkご案内資料
customercloud
PRO
0
650
滅・サービスクラス🔥 / Destruction Service Class
sinsoku
6
1.6k
Building Products in the LLM Era
ymatsuwitter
10
5k
Postman Flowsの基本 / Postman Flows Basics
yokawasa
1
100
【Developers Summit 2025】プロダクトエンジニアから学ぶ、 ユーザーにより高い価値を届ける技術
niwatakeru
2
1.2k
Data-centric AI入門第6章:Data-centric AIの実践例
x_ttyszk
1
390
次世代KYC活動報告 / 20250219-BizDay17-KYC-nextgen
oidfj
0
150
関東Kaggler会LT: 人狼コンペとLLM量子化について
nejumi
3
540
Featured
See All Featured
Six Lessons from altMBA
skipperchong
27
3.6k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.5k
Code Review Best Practice
trishagee
66
17k
Mobile First: as difficult as doing things right
swwweet
223
9.3k
Producing Creativity
orderedlist
PRO
343
39k
Code Reviewing Like a Champion
maltzj
521
39k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5.2k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.3k
How GitHub (no longer) Works
holman
313
140k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
A Philosophy of Restraint
colly
203
16k
Transcript
実は簡単!? AIを攻撃してみよう KOTOKAZE
この違いは?というお話です 出典: https://arxiv.org/pdf/1707.07397.pdf 亀を ジグソーパズル と分類している
そもそもAIって? 学習 推論 認識 記憶 の4つをコンピュータ上で行うもの
AI の分類 人工知能 機械学習 (ML) 深層学習 (DL) ML • 要設定
DL • 自動チューニング
機械学習 (ML) の分類 機械学習 教師あり • 分類 • 回帰 教師なし
強化学習
教師あり学習 分類 学習データ 判定したいもの 回帰 今後の 課金額 予測 年齢 性別
過去の 課金額 ログイン 日数 平均 ログイン 時間 ラベリング済み画像 出典: http://www.cs.toronto.edu/~kriz/cifar.html
教師なし学習: データの自動分類 0 0.5 1 1.5 2 2.5 3 3.5
0 0.5 1 1.5 2 2.5 3
強化学習 環境 エージェント ① 状態 ② 行動 ③ 報酬
モデルへの攻撃の余地 学習データの 収集・作成 モデルの学習 推論 学習データ汚染 学習モデル汚染 クエリ
画像分類器 (CNN) の学習の仕組み 出典: https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html 猫: 98.3% 熊: 0.14% 猫の確率が上がるよう
ウェイトを調整
敵対的サンプル (Adversarial Examples) 出典: http://www.iro.umontreal.ca/~memisevr/dlss2015/goodfellow_adv.pdf
AEs 攻撃の仕組み 出典: https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html 猫: 5.14% 熊: 99.2% 上から重ねる 摂動を調整
学習済みなので ウェイトは不変