Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[Journal club] Unbiased Scene Graph Generation ...

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

[Journal club] Unbiased Scene Graph Generation from Biased Training

More Decks by Semantic Machine Intelligence Lab., Keio Univ.

Other Decks in Technology

Transcript

  1. Kaihua Tang1, Yulei Niu3, Jianqiang Huang1,2, Jiaxin Shi4, Hanwang Zhang1

    (1Nanyang Technological University,2Damo Academy, Alibaba Group, 3Renmin University of China,4Tsinghua University) Unbiased Scene Graph Generation from Biased Training Tang, Kaihua, et al. "Unbiased scene graph generation from biased training." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020. 慶應矩塟倧孊 杉浊孔明研究宀 ç•‘äž­é§¿å¹³
  2. 2 • Scene Graph Generation (SGG) においお因果掚論の枠組みを甚いおデヌタセットが 䞎えるバむアスを䜎枛させる手法の提案 − Counterfactual

    Thinking − Total Direct Effect ( TDE ) • TDEを導入するこずでベヌスラむンからスコアの向䞊・バむアスの䜎枛 抂芁 ✓ SGGにおけるデヌタセットが䞎えるバむアスに関しお始めお考慮 ✓ 既存のSGGのフレヌムワヌクにそのたた適甚可胜
  3. 3 • Scene Graph ( SG )物䜓間における関係をグラフで衚珟したもの − Triplet <

    subject(object)predicateobject > • Scene Graph Generation ( SGG ) タスク画像からScene Graphを予枬する • SGの応甚䟋Vision Question Answering (VQA)Image RetrievalCaption Generationなど 背景SGGはVQAタスクなどのCV凊理ずしお提案された Yang, Jianwei, et al. "Graph r-cnn for scene graph generation." Proceedings of the European conference on computer vision (ECCV). 2018.
  4. 4 既存手法様々な角床からSGGモデルが蚭蚈されおいる SGG model 特城 MOTIFS [Rowan+, IEEE2018] シヌングラフの高次モチヌフを捉えるために蚭蚈 VC-Tree

    [Kaihua+, IEEE2019] 各オブゞェクトの䟝存有効性を蚈算するスコア関数を蚭蚈し スコア行列から最倧スパニングツリヌを2倀化したツリヌを䜜成 MOTIFS [Rowan+, IEEE2018] VC-Tree [Kaihua+, IEEE2019]
  5. 5 • そもそもデヌタセットの述語(predicate)の分垃に偏り − ロングテヌルな分垃 • 既存のSGGモデルの珟状 ☺ 物䜓怜出の粟床 

    関係(predicate)を衚す衚珟力の少なさ 問題点芖芚的な関係が些现であり情報量も少ない
  6. 6 • 意思決定は content ず context の組み合わせにより圢成されおいる − Content (内生的理由)subject・object

    の芖芚的特城量 − Context (倖生的理由)subjectずobjectの結合領域や察ずなる物䜓クラスの芖芚的特城 • 人間ず機械の意思決定の違い 仮説機械も因果関係の考慮によっお悪いバむアスを排陀 するこずができないか 人間 Causality-based 䞻因果を远求し悪いバむアス副因果を排陀 機械 Likelihood-based contentずcontextを合わせお尀床により予枬 機械にも䞻因果ず副因果を区別させたい
  7. 7 • Counterfactual causality ( 反事実因果関係 ) の考え − 「もしそのcontentを芋おなくおもそれでも同じ予枬をするのか」

    • 具䜓䟋アむスクリヌムず犯眪率の盞関関係 前提条件反事実仮想によっお䞻因果を予枬 「アむスクリヌムの売り䞊げが䞊がるず犯眪率が䞊がる」 → アむスクリヌムが犯眪に起因しおいる 気枩の䞊昇によっお人々が倖出する → アむスクリヌムの売り䞊げが䞊がる → 人が密集するので犯眪率も䞊がる 隠れた倉数の可胜性 → アむスクリヌムの排陀
  8. 8 • SGGのモデル − 既存手法のSGGをそのたた採甚 • Causal Graph − Counterfactual

    Thinking (反事実思考)をSGGに適甚 − Total Direct Effect ( TDE ) の蚈算により悪いバむアスを排陀 提案手法SGGにおけるCausal Graphの党䜓像
  9. 9 • Node 𝑰 ( Input Image  Backbone )

    − 入力画像 𝐌 をFaster R-CNN[Ren+, 2016] (FRCNN)に適甚 − ℳ 𝐌 の画像特城量・𝑩bounding box (bbox) の集合 • Link 𝑰 → 𝑿 (Object Feature Extractor) − FRCNNから RoI Align 特城量(𝑟𝑖 )・bbox(𝑏𝑖 )・ラベル情報(𝑙𝑖 )を 獲埗 − 𝐌𝑛𝑝𝑢𝑡: 𝑟𝑖 , 𝑏𝑖 , 𝑙𝑖 ⟹ 𝑂𝑢𝑡𝑝𝑢𝑡: {𝑥𝑖 } SGGの凊理(1/4)Node 𝐌, Link 𝐌 → 𝑋
  10. 10 • Node 𝑿 ( Object Feature ) − Subscript

    𝑒: 𝑥𝑒 = (𝑥𝑖 , 𝑥𝑗 )の䜜成 (ただし𝑖 ≠ 𝑗) • Link 𝑿 → 𝒁 ( Object Classification ) − 𝐌𝑛𝑝𝑢𝑡: 𝑥𝑖 ⟹ 𝑂𝑢𝑡𝑝𝑢𝑡: {𝑧𝑖 } • Node 𝒁 ( Object Class ) − 𝑧𝑒 = (𝑧𝑖 , 𝑧𝑗 )も含たれる SGGの凊理(2/4)Node 𝑋, Link 𝑋 → 𝑍, Node 𝑍
  11. 11 • Link 𝑿 → 𝒀 ( Object Feature Input

    for SGG ) − 𝐌𝑛𝑝𝑢𝑡: 𝑥𝑒 ⟹ 𝑂𝑢𝑡𝑝𝑢𝑡: {𝑥′𝑒 } • Link 𝒁 → 𝒀 ( Object Class Input for SGG ) − 𝑧′𝑒 = 𝑊 𝑧 [𝑧𝑖 ⚂𝑧𝑗 ] • Link 𝑰 → 𝒀 ( Visual Context Input for SGG ) − 𝑣′𝑒 = Convs(RoIAlign(ℳ, 𝑏𝑖 ∪ 𝑏𝑗 )) SGGの凊理(3/4)Link 𝑋 → 𝑌, Link 𝑍 → 𝑌, Link 𝐌 → 𝑌
  12. 12 • Node 𝒀 ( Predicate Classification ) − Link

    𝑋→𝑌・ Link 𝑍→𝑌・ Link 𝐌→𝑌によっお埗られた3皮類の 特城量 𝑥′𝑒  𝑧′𝑒  𝑣′𝑒 を入力ずしお2皮類の方法で蚈算 − SUM𝑊𝑒 = 𝑊 𝑥 𝑥′𝑒 + 𝑊 𝑣 𝑣′𝑒 + 𝑧′𝑒 − GATE 𝑊𝑒 = 𝑊 𝑟 𝑥′𝑒 ∙ 𝜎 𝑊 𝑥 𝑥′𝑒 + 𝑊 𝑣 𝑣′𝑒 + 𝑧′𝑒 • 損倱関数クロス゚ントロピヌ誀差関数 − Objectずpredicateに察しお䞻に䜿甚 − 補助的に各3぀のブランチにも適甚 SGGの凊理(4/4)Node 𝑌損倱関数
  13. 13 • 前頁たでの凊理によっおSGGã‚’å­Šç¿’ − 珟時点では尀床によるバむアスな予枬のたた • このSGGモデルに因果掚論の考えを適甚 − 介入(intervention)による反事実思考 (counterfactual

    thinking) • 䟋Link 𝐌 → 𝑋・ Link 𝑋 → 𝑍を切り離す − Node 𝑋にはダミヌの àŽ€ 𝑋を代入 − ただしNode 𝑍は以前のものを䜿甚 • 反事実思考の前埌の差から最終的なラベル を予枬 − Total Direct Effect (TDE) Causal Graph(1/3)孊習したSGGから因果掚論を考慮
  14. 14 • 介入 (intervention)の定矩𝒅𝒐(∙) − 𝑑𝑜(𝑋 = Ò§ 𝑥)Link 𝑰→𝑿

    (Object Feature Extractor)を削陀しダミヌ倉数を代入 − その結果 𝑍 = Ò§ 𝑧ずなる • 反事実 (counterfactual)の適甚 − 𝑑𝑜(𝑋 = Ò§ 𝑥)を適甚しおるがNode 𝑍は倉曎しない Causal Graph(2/3)介入ず反事実思考 実際の事実ずは別の過皋や結果を 想像するこず https://www.dhbr.net/articles/-/4705 今回はこちらを採甚
  15. 15 最終的なPredicateの予枬ラベル Causal Graph(3/3)Total Direct Effect 𝑇𝐷𝐞 = 𝑌𝑥,𝑧 𝑢

    − 𝑌 Ò§ 𝑥,𝑧 𝑢 𝑊𝑒 † = 𝑊𝑒 (𝑥, 𝑧) − 𝑊𝑒 ( Ò§ 𝑥, 𝑧) “2回思考”しおいる
  16. 19 • Scene Graph Generation (SGG) においお因果掚論の枠組みを甚いおデヌタセットが 䞎えるバむアスを䜎枛させる手法の提案 − Counterfactual

    Thinking − Total Direct Effect ( TDE ) • TDEを導入するこずでベヌスラむンからスコアの向䞊・バむアスの䜎枛 たずめ ✓ SGGにおけるデヌタセットが䞎えるバむアスに関しお始めお考慮 ✓ 既存のSGGのフレヌムワヌクにそのたた適甚可胜