実は簡単!? AIを攻撃してみよう

実は簡単!? AIを攻撃してみよう KOTOKAZE

この違いは？というお話です出典: https://arxiv.org/pdf/1707.07397.pdf 亀をジグソーパズルと分類している

そもそもAIって？学習推論認識記憶の４つをコンピュータ上で行うもの

AI の分類人工知能機械学習 (ML) 深層学習 (DL) ML • 要設定
DL • 自動チューニング

機械学習 (ML) の分類機械学習教師あり • 分類 • 回帰教師なし
強化学習

教師あり学習分類学習データ判定したいもの回帰今後の課金額予測年齢性別
過去の課金額ログイン日数平均ログイン時間ラベリング済み画像出典: http://www.cs.toronto.edu/~kriz/cifar.html

教師なし学習: データの自動分類 0 0.5 1 1.5 2 2.5 3 3.5
0 0.5 1 1.5 2 2.5 3

強化学習環境エージェント ① 状態 ② 行動 ③ 報酬

モデルへの攻撃の余地学習データの収集・作成モデルの学習推論学習データ汚染学習モデル汚染クエリ

画像分類器 (CNN) の学習の仕組み出典: https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html 猫: 98.3% 熊: 0.14% 猫の確率が上がるよう
ウェイトを調整

敵対的サンプル (Adversarial Examples) 出典: http://www.iro.umontreal.ca/~memisevr/dlss2015/goodfellow_adv.pdf

AEs 攻撃の仕組み出典: https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html 猫: 5.14% 熊: 99.2% 上から重ねる摂動を調整
学習済みなのでウェイトは不変

Kotokaze