Slide 1

Slide 1 text

CVPR 2021 個⼈的概要 Takehiro Matsuda

Slide 2

Slide 2 text

CVPRとは 毎年6⽉頃に開催されるコンピュータビジョンのトップカンファレンス(国際学会) IEEE Conference on Computer Vision and Pattern Recognitionの略称 https://github.com/hoya012/CVPR-2021-Paper-Statistics

Slide 3

Slide 3 text

参加者の国別、スポンサー企業

Slide 4

Slide 4 text

技術⽤語の傾向 • 単純なImage Classification は減少。(ImageNetなどの 性能は飽和気味) • ⾃動運転などでの Segmentationレベルの認 識需要はある。 • 3D, 動画を対象とするも のは多くなっている。 • 教師なし、⾃⼰教師、 弱教師あり、ドメイン 適応は増加傾向 • 画像⽣成系(GANなど)は引 き続き⼀⼤分野

Slide 5

Slide 5 text

ピックアップ論⽂

Slide 6

Slide 6 text

画像⽣成系の論⽂ GIRAFFE: Representing Scenes As Compositional Generative Neural Feature Field (Best paper) Michael Niemeye, Andreas Geiger Max Planck Institute for Intelligent Systems, ̈University of Tubingen 3次元で変化させたいパラーメータをコントロール して、⽣成できる

Slide 7

Slide 7 text

画像⽣成系の論⽂ Stylized Neural Painting Zhengxia Zou1, Tianyang Shi2, Shuang Qiu1, Yi Yuan2, Zhenwei Shi3 1University of Michigan, Ann Arbor, 2NetEase Fuxi AI Lab, 3Beihang University ⼈が油絵で対象を写⽣するようにストロークを再現し、写真から油絵のようにした 画像を⽣成する。

Slide 8

Slide 8 text

画像⽣成系の論⽂ Rethinking and Improving the Robustness of Image Style Transfer Pei Wang, Yijun Li, Nuno Vasconcelos UC, San Diego, Adobe Research, UC, San Diego Style Transferの特徴抽出として、VGGはうまく働くが 他のアーキテクチャではうまくいかない理由を解析

Slide 9

Slide 9 text

画像⽣成系の論⽂ Closed-Form Factorization of Latent Semantics in GANs Yujun Shen, Bolei Zhou The Chinese University of Hong Kong GANで⼈間にとって意味ある変化(視点変更、向き変更、 顔表情変化など)となるLatent space⽅向を⾒つける。 プロジェクトページ はコードやデモなど が揃っている

Slide 10

Slide 10 text

Segmentation Simultaneously Localize, Segment and Rank the Camouflaged Objects Yunqiu Lv1, Jing Zhang, Yuchao Dai, Aixuan Li, Bowen Liu, Nick Barnes, Deng-Ping Fan Northwestern Polytechnical University: China, Australian National University: Australia, CSIRO: Australia, Inception Institute of AI (IIAI): Abu Dhabi, UAE Camouflageな物体の検出(セグメンテーション)とそのカモフラージュぶりをランキングする End-to-Endなネットワーク

Slide 11

Slide 11 text

Segmentation Uncertainty-Aware Joint Salient Object and Camouflaged Object Detection Aixuan Li, Jing Zhang, Yunqiu Lv, Bowen Liu, Tong Zhang, Yuchao Dai Northwestern Polytechnical University: China, Australian National University: Australia CSIRO: Australia, EPFL: Switzerland SalientとCamouflageな物体の検出を1つのネットワークで実現する。 Similarity measureで特徴抽出をチューニングする。

Slide 12

Slide 12 text

Segmentation Fully Convolutional Networks for Panoptic Segmentation Yanwei Li, Hengshuang Zhao, Xiaojuan Qi, Liwei Wang, Zeming Li, Jian Sun, Jiaya Jia, The Chinese University of Hong Kong, University of Oxford, The University of Hong Kong, MEGVII Technology, SmartMore Foregroundの物体とBackgroundのもののセグメンテーションを統⼀した Fully-Convolutional Networksで実現する。 Kernel generator, Kernel Fusion, Feature Encoderの構成要素 Panoptic Segmentationという ⾔葉の論⽂は他にもあった

Slide 13

Slide 13 text

環境変化などに強い(⼀貫性のある)学習 Generative Interventions for Causal Learning Chengzhi Mao, Augustine Cha, Amogh Gupta, Hao Wang, Junfeng Yang, Carl Vondrick Columbia University, Rutgers University DNNはOut-of-distributioのサンプルがきたときに推定ミスをする。 外乱要因をGANのLatent spaceのPCAにより求める。

Slide 14

Slide 14 text

ロバストな学習 Augmentation Strategies for Learning With Noisy Labels Kento Nishi, Yi Ding, Alex Rich, Tobias Höllerer Lynbrook High School, San Jose CA, USA University of California Santa Barbara, Santa Barbara CA, USA 間違いラベルのあるデータだとlossの収束が遅い。 2種類のData Augmentationをloss analysisによる間違い ラベル解析と、モデルの汎化性向上のために適応する。

Slide 15

Slide 15 text

説明性 XProtoNet: Diagnosis in Chest Radiography With Global and Local Explanations Eunji Kim, Siwon Kim, Minji Seo, Sungroh Yoon Department of Electrical and Computer Engineering, Seoul National University, Seoul, South Korea ASRI, INMC, ISRC, and Institute of Engineering Research, Seoul National University 各症例の代表(Prototype)と類似性を⽐較 して、症例を推定できるネットワーク

Slide 16

Slide 16 text

説明性 Transformer Interpretability Beyond Attention Visualization Hila Chefer, Shir Gur, Lior Wolf The School of Computer Science, Tel Aviv University, Facebook AI Research (FAIR) Vision Transformerで各層のAttentionのGradientsとRelevanceをまとめて、 どこに注⽬して識別しているかヴィジュアル化する。

Slide 17

Slide 17 text

説明性 Black-Box Explanation of Object Detectors via Saliency Maps Vitali Petsiuk*, Rajiv Jain, Varun Manjunatha, Vlad I. Morariu, et al. Boston University, Adobe Research Classificationでなく、Object DetectionタスクでSaliency Maps(ヒートマップ)を 表⽰し、ネットワークがどこに着⽬して識別しているか⽰す。

Slide 18

Slide 18 text

継続学習 On Learning the Geodesic Path for Incremental Learning Christian Simon, Piotr Koniusz, Mehrtash Harandi| The Australian National University |Monash University Data61-CSIRO Incremenal Learningでクラス数を増やし ていったときのcatastrophic forgettingを 避けるため、古いモデルと新しいモデルの Feature subspaceを補間する蒸留を⾏う。

Slide 19

Slide 19 text

Active Learning Multiple Instance Active Learning for Object Detection Tianning Yua, Fang Wan, Mengying Fu, Jianzhuang Liu, Songcen Xu, Xiangyang Ji and Qixiang Ye University of Chinese Academy of Sciences, Beijing, China Noahʼs Ark Lab, Huawei Technologies, Shenzhen, China. Tsinghua University, Beijing, China Active Learningでモデル更 新のためラベル付けする データを選択するときに Uncertaintyを指標にするが、 画像全体でなく、画像の中 のInstanceに着⽬し、バッ クグラウンドノイズを抑制 し、Uncertaintyを計測する。