Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CVPR2021 個人的概要

koharite
July 14, 2021

CVPR2021 個人的概要

コンピュータビジョンのトップカンファレンスであるCVPR2021のオンライン聴講と論文に目を通しての個人的なまとめとしてのスライドを作成しました。

koharite

July 14, 2021
Tweet

More Decks by koharite

Other Decks in Research

Transcript

  1. CVPR 2021 個⼈的概要
    Takehiro Matsuda

    View full-size slide

  2. CVPRとは
    毎年6⽉頃に開催されるコンピュータビジョンのトップカンファレンス(国際学会)
    IEEE Conference on Computer Vision and Pattern Recognitionの略称
    https://github.com/hoya012/CVPR-2021-Paper-Statistics

    View full-size slide

  3. 参加者の国別、スポンサー企業

    View full-size slide

  4. 技術⽤語の傾向
    • 単純なImage Classification
    は減少。(ImageNetなどの
    性能は飽和気味)
    • ⾃動運転などでの
    Segmentationレベルの認
    識需要はある。
    • 3D, 動画を対象とするも
    のは多くなっている。
    • 教師なし、⾃⼰教師、
    弱教師あり、ドメイン
    適応は増加傾向
    • 画像⽣成系(GANなど)は引
    き続き⼀⼤分野

    View full-size slide

  5. ピックアップ論⽂

    View full-size slide

  6. 画像⽣成系の論⽂
    GIRAFFE: Representing Scenes As Compositional Generative Neural Feature
    Field (Best paper)
    Michael Niemeye, Andreas Geiger
    Max Planck Institute for Intelligent Systems, ̈University of Tubingen
    3次元で変化させたいパラーメータをコントロール
    して、⽣成できる

    View full-size slide

  7. 画像⽣成系の論⽂
    Stylized Neural Painting
    Zhengxia Zou1, Tianyang Shi2, Shuang Qiu1, Yi Yuan2, Zhenwei Shi3
    1University of Michigan, Ann Arbor, 2NetEase Fuxi AI Lab, 3Beihang University
    ⼈が油絵で対象を写⽣するようにストロークを再現し、写真から油絵のようにした
    画像を⽣成する。

    View full-size slide

  8. 画像⽣成系の論⽂
    Rethinking and Improving the Robustness of Image Style Transfer
    Pei Wang, Yijun Li, Nuno Vasconcelos
    UC, San Diego, Adobe Research, UC, San Diego
    Style Transferの特徴抽出として、VGGはうまく働くが
    他のアーキテクチャではうまくいかない理由を解析

    View full-size slide

  9. 画像⽣成系の論⽂
    Closed-Form Factorization of Latent Semantics in GANs
    Yujun Shen, Bolei Zhou
    The Chinese University of Hong Kong
    GANで⼈間にとって意味ある変化(視点変更、向き変更、
    顔表情変化など)となるLatent space⽅向を⾒つける。
    プロジェクトページ
    はコードやデモなど
    が揃っている

    View full-size slide

  10. Segmentation
    Simultaneously Localize, Segment and Rank the Camouflaged Objects
    Yunqiu Lv1, Jing Zhang, Yuchao Dai, Aixuan Li, Bowen Liu, Nick Barnes, Deng-Ping Fan
    Northwestern Polytechnical University: China, Australian National University: Australia,
    CSIRO: Australia, Inception Institute of AI (IIAI): Abu Dhabi, UAE
    Camouflageな物体の検出(セグメンテーション)とそのカモフラージュぶりをランキングする
    End-to-Endなネットワーク

    View full-size slide

  11. Segmentation
    Uncertainty-Aware Joint Salient Object and Camouflaged Object Detection
    Aixuan Li, Jing Zhang, Yunqiu Lv, Bowen Liu, Tong Zhang, Yuchao Dai
    Northwestern Polytechnical University: China, Australian National University: Australia
    CSIRO: Australia, EPFL: Switzerland
    SalientとCamouflageな物体の検出を1つのネットワークで実現する。
    Similarity measureで特徴抽出をチューニングする。

    View full-size slide

  12. Segmentation
    Fully Convolutional Networks for Panoptic Segmentation
    Yanwei Li, Hengshuang Zhao, Xiaojuan Qi, Liwei Wang, Zeming Li, Jian Sun, Jiaya Jia,
    The Chinese University of Hong Kong, University of Oxford, The University of Hong Kong, MEGVII Technology,
    SmartMore
    Foregroundの物体とBackgroundのもののセグメンテーションを統⼀した
    Fully-Convolutional Networksで実現する。
    Kernel generator, Kernel Fusion, Feature Encoderの構成要素
    Panoptic Segmentationという
    ⾔葉の論⽂は他にもあった

    View full-size slide

  13. 環境変化などに強い(⼀貫性のある)学習
    Generative Interventions for Causal Learning
    Chengzhi Mao, Augustine Cha, Amogh Gupta, Hao Wang, Junfeng Yang, Carl Vondrick
    Columbia University, Rutgers University
    DNNはOut-of-distributioのサンプルがきたときに推定ミスをする。
    外乱要因をGANのLatent spaceのPCAにより求める。

    View full-size slide

  14. ロバストな学習
    Augmentation Strategies for Learning With Noisy Labels
    Kento Nishi, Yi Ding, Alex Rich, Tobias Höllerer
    Lynbrook High School, San Jose CA, USA
    University of California Santa Barbara, Santa Barbara CA, USA
    間違いラベルのあるデータだとlossの収束が遅い。
    2種類のData Augmentationをloss analysisによる間違い
    ラベル解析と、モデルの汎化性向上のために適応する。

    View full-size slide

  15. 説明性
    XProtoNet: Diagnosis in Chest Radiography With Global and Local
    Explanations
    Eunji Kim, Siwon Kim, Minji Seo, Sungroh Yoon
    Department of Electrical and Computer Engineering, Seoul National University, Seoul, South Korea
    ASRI, INMC, ISRC, and Institute of Engineering Research, Seoul National University
    各症例の代表(Prototype)と類似性を⽐較
    して、症例を推定できるネットワーク

    View full-size slide

  16. 説明性
    Transformer Interpretability Beyond Attention Visualization
    Hila Chefer, Shir Gur, Lior Wolf
    The School of Computer Science, Tel Aviv University, Facebook AI Research (FAIR)
    Vision Transformerで各層のAttentionのGradientsとRelevanceをまとめて、
    どこに注⽬して識別しているかヴィジュアル化する。

    View full-size slide

  17. 説明性
    Black-Box Explanation of Object Detectors via Saliency Maps
    Vitali Petsiuk*, Rajiv Jain, Varun Manjunatha, Vlad I. Morariu, et al.
    Boston University, Adobe Research
    Classificationでなく、Object DetectionタスクでSaliency Maps(ヒートマップ)を
    表⽰し、ネットワークがどこに着⽬して識別しているか⽰す。

    View full-size slide

  18. 継続学習
    On Learning the Geodesic Path for Incremental Learning
    Christian Simon, Piotr Koniusz, Mehrtash Harandi|
    The Australian National University |Monash University Data61-CSIRO
    Incremenal Learningでクラス数を増やし
    ていったときのcatastrophic forgettingを
    避けるため、古いモデルと新しいモデルの
    Feature subspaceを補間する蒸留を⾏う。

    View full-size slide

  19. Active Learning
    Multiple Instance Active Learning for Object Detection
    Tianning Yua, Fang Wan, Mengying Fu, Jianzhuang Liu, Songcen Xu, Xiangyang Ji and Qixiang Ye
    University of Chinese Academy of Sciences, Beijing, China
    Noahʼs Ark Lab, Huawei Technologies, Shenzhen, China. Tsinghua University, Beijing, China
    Active Learningでモデル更
    新のためラベル付けする
    データを選択するときに
    Uncertaintyを指標にするが、
    画像全体でなく、画像の中
    のInstanceに着⽬し、バッ
    クグラウンドノイズを抑制
    し、Uncertaintyを計測する。

    View full-size slide