Trend Micro CTF 2019に挑んだ～模擬監視カメラ映像解析編～/tmctf2019_wildcard300

Trend Micro CTF 2019に挑んだ～模擬監視カメラ映像解析編～第36回ゼロから始めるセキュリティ入門勉強会 meow (id: meow_noisy)
2020/09/16(水)

事前のお詫び  セキュリティの話題でないかもしれません  『CTF ≠ セキュリティ』でした  LT前座の小噺ということでお聞きいただければ…

発表概要  2019年9月に行われたTrend Micro CTF 2019の予選問題に 1年越しに挑んだ

おしながき  Trend Micro CTF 2019  CTFとは  Trend
Micro CTF概要  CTFの問題  答案  答え合わせ  ふろく  使用した機械学習モデルに関しての細かい情報

CTF(Capture The Flag)とは  ハッカーの腕くらべのためのコンテスト  フラグと呼ばれる文字列をお題から取得することで力量を測る  フラグを取得する方法が、世間で言う情報セキュリティの
脆弱性を突く行為を以てすることが多い  コンピュータに関する様々な知識が問われる

どんなジャンルがあるの? 第8回CTF勉強会.pdfより

Trend Micro CTF 2019とは  トレンドマイクロ社が主催するCTF  https://www.trendmicro.com/ja_jp/campaigns/capture-the- flag.html 
9月にオンライン予選の選抜、11月に本戦があった  優勝賞金100万円

前回(2019年9月)のLT#31  機械学習カテゴリに挑んだ件を報告 https://www.slideshare.net/meownoisy/trend-micro-ctf-2019/meownoisy/trend-micro-ctf-2019

CTF自体は終わったが  問題自体はTMCTF終了後も見ることができたので、アーカイブを取った  今回は映像解析タスクの1問に挑んだ

[余談]映像を扱ったCTF  SECCON TOWER 2016  https://www.youtube.com/watch?v=Y6voaURtKlM  ロボットアームの手旗信号を解読する 
Needle in a haystack(SECCON 2018)  https://www.youtube.com/watch?v=sTKP2btHSBQ  9時間を超えるお天気カメラの映像からフラグを取得する

Wildcard300 問題文(原文)

問題設定  Flagmanという男は監視カメラ越しにフラグを伝える  ある日、悪いハッカーに監視カメラを攻撃され、映像を壊されてしまった  あなたは映像を解析し、Flagmanの伝えたかったフラグ 14文字分を回収しよう

とりあえず映像を見てみよう  3DCGだった  屋外  同じキャラが延々と歩いている  尺は17分50秒 
解像度は640x480px  形式はavi

とりあえず映像を見てみよう  一般の通行人に混じって、Flagmanという黒ずくめの男が体にフラグの文字をペイントして歩いている  この胸の文字がフラグの一部

とりあえず映像を見てみよう  最初の5分間は正常  14文字の内`TMCTF{`までは確定

とりあえず映像を見てみよう  その後攻撃を受け、映像のフレームが飛び飛びになる  文脈は使えない 1フレーム後

とりあえず映像を見てみよう  そして最後の文字`}`

今一度ルール把握  攻撃のあった10分間の中から、flagmanを見つけ出し、 TMCTF{} の中身の7文字を見つけてくる  その他の細かい制約  Flagmanは必ず1つのASCII文字を身につけている 
同じフラグが連続して出現することはない  画像フレームの順序は入れ替えられていない

取ったアプローチ  何も考えずDeep Learningに飛びつく  Flagmanが写っている/いないを学習させればいいんではいるいない

機械学習? Deep Learning? AI?  機械学習  プログラムの処理判断基準をデータから自動的に獲得させる技術  Deep
Learning  機械学習手法の1種。Deep Neural Network(DNN)という機械学習の総称。DNNは特徴抽出に長けており一般的に性能が高い。  AI  機械学習プロダクトを雰囲気でイメージしてもらう時に使う言葉図: https://semla.polymtl.ca/wp-content/uploads/2019/06/Ma-semla.pdf

下ごしらえ  動画をフレームにバラす  全19,266枚  約18fps

学習データ  いる/いないがわかっている冒頭5分間のフレームを学習データとした  各フレームがいる/いないのラベルが必要

フレームのラベリング  攻撃を受ける前の冒頭5分のうちFlagmanが映っている時間を目視で記録  時間をフレームに換算  Flagmanの映っているフレームは1のインデックス、それ以外を0のインデックスをラベリングフレーム番号,
映るorNot 経過秒 → フレーム番号変換

使用したAIの構造  ResNet-18  層をたくさん積んでも学習できるようにした画像分類用のネットワーク  このネットワークで画像の「いる/いない」学習した https://www.researchgate.net/figure/ Architecture-of-ResNet-18-Figure-from-reference-18_fig1_332303940
画像いる/いない +

学習したAIでの分類  学習したAIに、攻撃後のフレーム約13,000枚を与え、 Flagmanが映っている/いないを分類  分類結果は信頼度†を出せる  †: イメージ的には、
AIがどれくらい答えに自信を持っているかのパーセンテージ  正しくは事後確率といういない (いる確率2%) いる (いる確率 99%) 攻撃後のフレーム

フレーム収集基準  AIが信頼度90%以上で「いる」と答えたフレームを集める  520枚のフレームが集まった

人間のチェック  520枚を後は目視で7枚探した  全部あった一応フレームインデックス番号 6121 6355 9006
12750 13622 15850 18111

裏取り  一応、攻撃後のフレーム約13,000枚を目視で確認  1.5時間くらいで終了  flagmanが映っているフレームが7枚以外に無いことを確認

所感  1.5人/時間で解けるならコード書くよりも人力チェックの方が早いかも・・・  チーム人数制限もないし… 上位陣で解いていなかったチームも見かけた

まとめ  TMCTF2019の問題に挑んだ  一応、回答は作れた  “TMCTF{46AIC46}”

2020年度のTMCTFは?  予選が10月開催決定  登録受付中! https://www.trendmicro.com/ja_jp/campaigns/capture-the-flag.html

参考文献  人工知能学会監修 (2015)『深層学習 Deep Learning』近代科学社  原田達也
(2017) 『画像認識』講談社  宮本・大川・毛利著 (2018)『PyTorchニューラルネットワーク実装ハンドブック』秀和システム

ご清聴ありがとうございました

ふろく使用した機械学習モデルに関しての細かい情報

開発リポジトリ  ツールは下記に配置  https://github.com/meow-noisy/tmctf2019-wildcard300  一応、学習時の重み(state dict)ファイルも上げた

MLモデル  ResNet-18  ImageNetのpretrained weightを使用してfine-tuning  最終層の構造をいじって、1,000→2クラスのロジットを吐くようにした 
GPU推論で10,000枚 10分程度  GTX1070使用

学習におけるパラメータ  入力サイズ: 640x480のまま  データオーグメンテーションは一切なし  ドロップアウトなし  いる/いないで枚数の違いがあるので、枚数比の学習のペナ
ルティをかけた  大体1:4の割合なので、いるのにいないと判断した時のペナルティを4倍にする  train:val = 8:2

学習時のやらかし  valのaccuracyがほぼ100  ランダムサンプリングでvalデータを作ってしまったので、leakage が起きていそうだと資料作っている時に気づいた  とはいえ、CGモデルの動きは単調なので、依然として高い accuracyになったと思う

Trend Micro CTF 2019に挑んだ ～模擬監視カメラ映像解析編～/tmctf20...

Trend Micro CTF 2019に挑んだ ～模擬監視カメラ映像解析編～/tmctf2019_wildcard300

More Decks by meow

Other Decks in Technology

Featured

Transcript

Trend Micro CTF 2019に挑んだ～模擬監視カメラ映像解析編～/tmctf20...

Trend Micro CTF 2019に挑んだ～模擬監視カメラ映像解析編～/tmctf2019_wildcard300