MIRU2020若手の会グループA発表

品川政太朗, 岩本蘭, ⾼⽥雅之, 真殿航輝, 三好遼
Mentor : 福井宏 Retina-like Visual Image Reconstruction via Spiking Neural Model MIRU若⼿の会2020 Group-A 発表 8/1 (⼟) 16:25~16:55 @zoom

背景リアルタイムで動作するアプリケーションでは，迅速に反応する vision processing が必要となる．ハイスピードなモーションをブレ・ボケなく取得したい 2

センサの⽐較 Spikeカメラは，ハイスピードなシーンの撮影に向いている． Time スパイク列 1 0 センサ動作速度データの取得⽅法
露光時間の設定従来のカメラ数⼗Hz 同期ピクセル毎の設定不可 Spikeカメラ 40,000Hz ⾮同期ピクセル毎の設定可 3

⼤きく2つに分類 1. ルールベースによる再構成 (発⽕間隔, Windowベース） 2. 適応的閾値・⽣物の情報処理の仕組みを基にした再構成 Spike data からの画像再構成（従来研究）
Texture from Playback (TFP) Texture from ISI (TFI) Texture from Adaptive threshold (TFA) 4

従来研究の課題コントラストの低下・ノイズ Raw spike TFW（ルールベース） TFI（ルールベース） TFA（適応的閾値）ルールベース⼿法：発⽕の閾値が⼀定，スパイクの統計情報を利⽤していない適応的閾値を⽤いた⼿法：スパイクの統計情報を利⽤していない 5

提案⼿法の特徴 Spikeカメラを⽤いたハイスピードなシーンの画像再構成を実現 1. Spiking Neural Networksによる画像再構成 2. Dynamic threshold とスパイクの統計情報を活⽤して性能を向上
Method 動画 Dynamic threshold スパイクの統計情報の利⽤ TFW（ルールベース） TFI（ルールベース） ✔ TFA（適応的閾値） ✔ Ours ✔ ✔ ✔ 6

提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation
layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike reﬁning layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像スパイク列 static dynamic static dynamic 7

layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike refining layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像スパイク列 static dynamic static dynamic 8

Motion local excitation layer (MLEL) ⼊⼒されたスパイク列をstatic/dynamicに分類する層 Spike plane スパイク列 t
y static/dynamicに分割 Motion conﬁdence matrixの⽣成 dynamic static ⼀定間隔 ✖⼀定間隔 static dynamic スパイク列 MLEL t dynamic t t static x 9

ポイント : 輝度とスパイクの発⽕間隔が相関輝度スパイク列時間明るい輝度が⾼い→スパイクの発⽕間隔が狭い輝度が低い→スパイクの発⽕間隔が広い 10

ポイント : 輝度の変化と発⽕間隔が相関スパイク間隔は分散の⼩さい正規分布に従う輝度が⼀定 t t 発⽕間隔が
ほぼ⼀定 p(t) スパイク間隔は分散の⼤きい正規分布に従う輝度が⾮⼀定 t t 発⽕間隔が⼀定でない p(t) スパイクの履歴で分布近似スパイク間隔スパイク間隔 static dynamic 11

ポイント : Spike履歴による近似分布からConfidenceを算出 t 新しく観測した Spike列なだらかな正規分布 StaticなSpikeの履歴でできた正規分布 →Static /
dynamicの判定が可能スパイク間隔スパイク間隔 Confidence Confidence 分布近似に使ったスパイクの履歴 DynamicなSpikeの履歴でできた正規分布 → Static / dynamicの判定が難しい急峻な正規分布急峻 or なだらかな分布に⼀定 0.9 0.2 12

ConfidenceからMotion confidence matrixの⽣成 static spikeである確率 (Confidence)の計算 Motion confidence matrixの⽣成 dynamic
スパイク間隔を観測 static dynamic static ある時刻tのスパイク x y x y t y x t y x スパイク列 Motion confidence matrixの⽣成 static/dynamicに分割 13

グラフカットにより、各要素をstatic/dynamicに分割 Motion conﬁdence matrix T S グラフカットにより MRFのコストを最⼩化する境界線を探索 T
S 各要素をstatic/dynamicに領域分割 dynamic static スパイク列 static/dynamicに分割 Motion confidence matrixの⽣成 t y x 14

layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike refining layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像スパイク列 static dynamic static dynamic 15

LIFニューロンを⽤いたノイズ除去を⾏う層 Spike refining layer (SRL) static SRL noise t V
LIFニューロンの膜電位Vは発⽕してから⼊⼒スパイクの影響を受けない期間 (不応期) が存在不応期のスパイクをノイズとみなす⽅法 (ノイズを⾃然に除去することが可能) 不応期発⽕ dynamic t t static dynamic t t 16

layer (MLEL) : 発⽕間隔別に分割 - static(発⽕間隔が⼀定) / dynamic(発⽕間隔が⾮⼀定) に分割 2. Spike reﬁning layer (SRL) : Spike列のノイズ除去 3. Visual reconstruction layer (VRL) : Spike列からの画像再構成 MLEL SRL VRL 認識画像スパイク列 static dynamic static dynamic 17

Visual reconstruction layer スパイクからグレースケール画像を再構成する層 STDPによる教師なし学習 dynamic thresholdによる画素値算出 static/dynamic
スパイク 18

STDP(spike timing dependent plasticity) スパイクからグレースケール画像を再構成する層 STDPによる教師なし学習 dynamic thresholdによる画素値算出
• SNNの教師なし学習に⽤いられる⼿法 • 2層間のスパイクの発⽕タイミングで重みを更新する 2層⽬ 3層⽬ (a) 重みを⼤きくする場合 2層⽬が発⽕→3層⽬が発⽕ (b) 重みを⼩さくする場合 3層⽬が発⽕→2層⽬が発⽕ static/dynamic スパイク 2層⽬ 3層⽬ 19

STDPによる重みの更新計算スパイクからグレースケール画像を再構成する STDPによる教師なし学習 dynamic thresholdによる画素値算出ある時間区間ごとに各層の発⽕時刻を全て記録し，逐次的に更新するスパイク発⽕時刻
• 2層⽬：t!"# = t$, t%, … • 3層⽬：t!&'( = ̂ t$, ̂ t%, … ただし、& A w = A) w > 0, τ = τ) (t!&'( − t!"# > 0) A w = A* w < 0, τ = τ* (t!&'( − t!"# < 0) 重みが増⼤重みが減少時刻の近いスパイクが更新幅に⼤きく影響する Δw = , !!"# , !!$%& A w exp − t"#$! − t"%& /τ static/dynamic スパイク 20

重みの初期化⽅法スパイクからグレースケール画像を再構成する STDPによる教師なし学習 dynamic thresholdによる画素値算出同じ位置に近いほど⼤きな重みとなるよう初期化 (正規分布を利⽤) •
位置の近いニューロンほど同じタイミングで発⽕ • 再構成時の近傍画素値をスムージングする役割重みW 2層⽬ 3層⽬ static/dynamic スパイク 21

Dynamic thresholdによる画素値算出スパイクからグレースケール画像を再構成する STDPによる教師なし学習 dynamic thresholdによる画素値算出 Dynamic thresholdとは？
• ニューロンの発⽕閾値を変化させて発⽕頻度を⼀定にする仕組み • 元々は⽣物ニューロンで知られる同期現象を模すために提案された • 著者らは，LIFモデルを⼀般化したspike response model (SRM) [1] 由来の⼿法を採⽤ [1] Mensi S, Naud R, Pozzorini C, Avermann M, Petersen CC, Gerstner W. Parameter extraction and classiﬁcation of three cortical neuron types reveals two distinct adaptation mechanisms. J Neurophysiol. 2012;107(6):1756-1775. ん？発⽕頻度が⼀定になる？発⽕頻度が持っていた輝度情報はどこへ？代わりにdynamic thresholdが輝度になるにゃ！ static/dynamic スパイク 22

ϑ23(t) Dynamic threshold ϑ!" (t)の仕組み V V%&$! t t t
重み付き⼊⼒スパイクS'( (t) 出⼒スパイクS'( ) (t) お互いに上昇と下降を繰り返すスパイク発⽕時の膜電位が徐々に上にズレてるところに注⽬だにゃ！膜電位V dynamic thresholdと膜電位が同じ値になるとスパイクが出る輝度 23

膜電位V ϑ+, t = ϑ- + 2 - . θ+,
s S+, / t − s ds ϑ23(t) Dynamic threshold ϑ!" (t)の畳み込み計算 V%&$! t t t 重み付き⼊⼒スパイクS'( (t) 出⼒スパイクS'( ) (t) 時間で単調減少するフィルタθ+, t と出⼒スパイクS+, / (t)の畳み込みで計算 Wikipedia “畳み込み”より θ+, t は指数関数 ϑ+, t ϑ+,(t)は，スパイクが発⽕すると急上昇して徐々に減少する V 輝度 24 畳み込み : https://ja.wikipedia.org/wiki/%E7%95%B3%E3%81%BF%E8%BE%BC%E3%81%BF#/media/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Convolucion_de_entrada_con_respuesta_al_impulso.gif

フィルタθ+, t は，⼊⼒の総和が⼤きいほどdynamic thresholdの下がり具合を⼩さくする →発⽕するまでの閾値が上昇 ϑ23 (t) フィルタによるdynamic
thresholdの値の変化 V V%&$! t t t 重み付き⼊⼒スパイクS'( (t) 出⼒スパイクS'( ) (t) θ+, t = η- exp − t − t0 τ ∫ (! ( S+, x dx (b) ⼊⼒がstatic のとき (a) ⼊⼒がdynamic のとき θ+, t = η- exp − t − t1 τ フィルタの形と閾値は⼀定発⽕閾値が上昇輝度 25

Dynamic threshold ϑ!" t を輝度 G!,",$ として表現 (a) ⼊⼒がdynamic のとき：
ϑ+, t は動いてるので短い時間区間で近似 (b) ⼊⼒がstaticのとき： ϑ+, t は⼀定値なのでそのまま G2,3,6 = ϑ23 t G+,,,( = ϑ+, t* ⋅ t − t* t* ⋅ 2 - (" S+, x dx *3 V S+, t t t7 ϑ+, t* 輝度の変化を抑える調整項輝度低めに調整⾼めに調整スパイクたくさん来たあまり来ないフィルタの収束予定値 26

実験評価⽅法 1. 画像の⾒た⽬の⽐較( 定性評価 ) 2. 画質評価指標での⽐較 (定量評価 )
⽐較⼿法動画 Dynamic threshold スパイクの統計情報 TFW TFI ✓ TFA ✓ ours ✓ ✓ ✓ 27

TFW TFI コントラストが低い TFA 明暗をうまく調節不可 Ours コントラストが丁度よい Normal speed (flower)
Raw spike TFW TFI TFA Ours 28

High speed (car 100km/h) TFI 即時的な輝度のみを考慮 Ours 過去のスパイク列を考慮 Raw spike
TFI Ours 29

定量評価 (画質) 画質についての2つの評価指標で⾼精度 30

定量評価 (high speed) 評価指標 STD (standard deviation) : 画像のコントラストの評価指標 CPBD
(a noreference image blur metric) : motion blurの評価指標 31

まとめ 3層Spiking Neural Networkを⽤いた画像再構成 t スパイク列 ① Motion local excitation
layer 画像のstatic/dynamicな部分を分割 ② Spike refining layer ノイズ除去 ③ Visual reconstruction layer グレースケール画像の再構成過去のspike列と動的閾値を考慮しハイスピードなシーンでの再構成画像の画質改善 32

MIRU2020若手の会グループA発表

MIRU2020若手の会グループA発表

koki madono

More Decks by koki madono

Other Decks in Research

Featured

Transcript

品川政太朗, 岩本蘭, ⾼⽥雅之, 真殿航輝, 三好遼

背景リアルタイムで動作するアプリケーションでは，迅速に反応する vision processing が必要となる．ハイスピードなモーションをブレ・ボケなく取得したい 2

センサの⽐較 Spikeカメラは，ハイスピードなシーンの撮影に向いている． Time スパイク列 1 0 センサ動作速度データの取得⽅法

⼤きく2つに分類 1. ルールベースによる再構成 (発⽕間隔, Windowベース） 2. 適応的閾値・⽣物の情報処理の仕組みを基にした再構成 Spike data からの画像再構成（従来研究）

提案⼿法の特徴 Spikeカメラを⽤いたハイスピードなシーンの画像再構成を実現 1. Spiking Neural Networksによる画像再構成 2. Dynamic threshold とスパイクの統計情報を活⽤して性能を向上

提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

Motion local excitation layer (MLEL) ⼊⼒されたスパイク列をstatic/dynamicに分類する層 Spike plane スパイク列 t

ポイント : 輝度とスパイクの発⽕間隔が相関輝度スパイク列時間明るい輝度が⾼い→スパイクの発⽕間隔が狭い輝度が低い→スパイクの発⽕間隔が広い 10

ポイント : 輝度の変化と発⽕間隔が相関スパイク間隔は分散の⼩さい正規分布に従う輝度が⼀定 t t 発⽕間隔が

ポイント : Spike履歴による近似分布からConfidenceを算出 t 新しく観測した Spike列なだらかな正規分布 StaticなSpikeの履歴でできた正規分布 →Static /

ConfidenceからMotion confidence matrixの⽣成 static spikeである確率 (Confidence)の計算 Motion confidence matrixの⽣成 dynamic

グラフカットにより、各要素をstatic/dynamicに分割 Motion conﬁdence matrix T S グラフカットにより MRFのコストを最⼩化する境界線を探索 T

提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

LIFニューロンを⽤いたノイズ除去を⾏う層 Spike refining layer (SRL) static SRL noise t V

提案モデル : Spiking Neural Network 3つの層で構成 1. Motion local excitation

Visual reconstruction layer スパイクからグレースケール画像を再構成する層 STDPによる教師なし学習 dynamic thresholdによる画素値算出 static/dynamic

STDP(spike timing dependent plasticity) スパイクからグレースケール画像を再構成する層 STDPによる教師なし学習 dynamic thresholdによる画素値算出

STDPによる重みの更新計算スパイクからグレースケール画像を再構成する STDPによる教師なし学習 dynamic thresholdによる画素値算出ある時間区間ごとに各層の発⽕時刻を全て記録し，逐次的に更新するスパイク発⽕時刻

重みの初期化⽅法スパイクからグレースケール画像を再構成する STDPによる教師なし学習 dynamic thresholdによる画素値算出同じ位置に近いほど⼤きな重みとなるよう初期化 (正規分布を利⽤) •

Dynamic thresholdによる画素値算出スパイクからグレースケール画像を再構成する STDPによる教師なし学習 dynamic thresholdによる画素値算出 Dynamic thresholdとは？

ϑ23(t) Dynamic threshold ϑ!" (t)の仕組み V V%&$! t t t

膜電位V ϑ+, t = ϑ- + 2 - . θ+,

フィルタθ+, t は，⼊⼒の総和が⼤きいほどdynamic thresholdの下がり具合を⼩さくする →発⽕するまでの閾値が上昇 ϑ23 (t) フィルタによるdynamic

Dynamic threshold ϑ!" t を輝度 G!,",$ として表現 (a) ⼊⼒がdynamic のとき：

実験評価⽅法 1. 画像の⾒た⽬の⽐較( 定性評価 ) 2. 画質評価指標での⽐較 (定量評価 )

TFW TFI コントラストが低い TFA 明暗をうまく調節不可 Ours コントラストが丁度よい Normal speed (flower)

High speed (car 100km/h) TFI 即時的な輝度のみを考慮 Ours 過去のスパイク列を考慮 Raw spike

定量評価 (画質) 画質についての2つの評価指標で⾼精度 30

定量評価 (high speed) 評価指標 STD (standard deviation) : 画像のコントラストの評価指標 CPBD

まとめ 3層Spiking Neural Networkを⽤いた画像再構成 t スパイク列 ① Motion local excitation