“Learning to Exploit Multiple Vision Modalities by Using
Grafted Networks”
Hu Yuhuang, Tobi Delbruck, Shih-Chii Liu
第五回 全日本コンピュータビジョン勉強会 ECCV2020読み会
Godel
@___Godel
参照論文:http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123610086.pdf 参照動画:https://www.youtube.com/watch?v=sUqFM4xCZHI
接ぎ木ネットワークを用いた複数の視覚モダリティに対する学習法
The Institute of
Neuroinformatics in Zurich,
(the University of Zurich and
ETH Zurich共同研究所)
センサグループ
博士課程学生
チューリッヒ工科大学教授
センサグループ
Event Cameraの開発者
The Institute of
Neuroinformaticsセンサグ
ループリーダー
紹介論文
Slide 9
Slide 9 text
補足:イベントカメラ
• Event-based Camera
• 輝度の変化が生じたピクセル毎に、画像としてではなく
(画素X,画素Y,輝度変化が生じた時間)
を出力する2次元のイメージセンサ
• 高速撮影可能(1000FPS以上)
• 高ダイナミックレンジ(輝度変化や明暗が大きくても撮影可能)
• IROS2013 WORKSHOP にて PROF.DAVIDE SCARAMUZZA(ETH)等が紹介し、研
究の中核となる。
• EVENT-BASED CAMERAは研究としては最盛期
• HTTP://RPG.IFI.UZH.CH/RESEARCH_DVS.HTML ( SCARAMUZZA研)
• SSII2020チュートリアルセッション EVENT-BASED CAMERA の基礎とニューラルネット
ワークによる信号処理
HTTPS://CONFIT.ATLAS.JP/GUIDE/EVENT/SSII2020/STATIC/LECTURENOTES
• CVPR2020 WORKSHOP UNCONVENTIONAL SENSORS IN ROBOTICS: PERCEPTION
FOR ONLINE LEARNING, ADAP-TIVE BEHAVIOR, AND COGNITION
• PROFESEE(HTTPS://WWW.PROPHESEE.AI/BUY-EVENT-BASED-PRODUCTS-2/)がSONY
と提携し商品開発
• 今後の課題
• 応用利用、実環境での利用
• SPIKING NEURAL NETWORKとの連携
https://gfycat.com/incredibleimpoliteblackmamba
D. Falanga, S. Kim, D. Scaramuzza
How Fast is Too Fast? The Role of Perception Latency in High-Speed Sense
and Avoid
IEEE Robotics and Automation Letters (RA-L), 2019.
遠赤外線画像での物体検出(車)結果
参照論文:http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123610086.pdf 参照動画:https://www.youtube.com/watch?v=sUqFM4xCZHI
The dataset has 4,855 training intensity-thermal
pairs, and 1,256 testing pairs, of which 60% are
daytime and 40% arenighttime driving samples.
Slide 15
Slide 15 text
参照論文:http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123610086.pdf 参照動画:https://www.youtube.com/watch?v=sUqFM4xCZHI
イベントカメラ画像での物体検出(車)結果
We generated in total 7,000 intensity
frames and event volume pairsfrom this
recording. Each event volume containsN=
25,000 events. The first5,000 pairs are
used as the training dataset, and the last
2,000 pairs are usedas the testing
dataset.
Slide 16
Slide 16 text
GNの性質
GNのfront end はどのくらいの層が必要か?
・入力するドメイン画像、出力するドメイン画像により変化する
・データセット依存もある
中間情報は、何を表しているか?
・必要な情報を含む画像情報となっている
参照論文:http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123610086.pdf 参照動画:https://www.youtube.com/watch?v=sUqFM4xCZHI
Slide 17
Slide 17 text
Ablation Study on Loss Terms
参照論文:http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123610086.pdf 参照動画:https://www.youtube.com/watch?v=sUqFM4xCZHI