CVPR2019 参加速報本会議1日目 / CVPR2019 Personal Memo: Day 1

CVPR2019 ຊձٞॳ೔ ଎ใ

- ࡢ೥·Ͱͱಉ༷ɺݸਓͷϝϞΛެ։͍ͯ͠ΔΑ͏ͳܗͷ΋ͷͰ͢ɻ͋͘·Ͱ ΋ɺͪΒ͠ͷཪతͳѻ͍Ͱ͓ئ͍͠·͢ - ࢲͷཧղͷँΓ΋ଟʑ͋Δͱࢥ͍·͢ͷͰ͝༰͍ࣻͩ͘͞ɻ ࠓճ͔Βޱ಄ൃද͸γϣʔτΦʔϥϧͷΈʹͳΓ·ͨ͠ɻ5෼ൃදx3݅ຖʹ3෼ͷ࣭͕ٙ͋Δܗ(ܭ18෼) ͰਐΜͰ͍͘ܗͰ͢ɻΈΜͳख๏ͷৄࡉ·Ͱ࿩ͤͣɺͪΐͬͱUXͷ௿͍ܗࣜͩͬͨ=ࣸਅͱͬͨΓϝϞ ͢ΔՋ͕ͳ͔ͬͨͷͰɺࠓճ͸ࣗ෼͕ฉ͍ͨൃදΛϙελʔͷΈʹߜͬͯྻڍɻ

ಉҰ෺ମผ࢟੎ͷ2ͭͷಛ௃͕Ұக͢Δ Α͏Siamese LossΛ͔͚ͭͭɺޓ͍Λઢ ܗม׵͢Δͱผ࢟੎ͷsegmentΛநग़Ͱ ͖ΔΑ͏ʹֶशˠະ஌෺ମͰCoSeg͕Ͱ ͖ΔΑ͏ʹͳΔɻ

؆୯ͳαϯϓϧ͔ΒঃʑʹDA͢Δ ͱͪΐͬͱਫ਼౓͕͋Δɻ SOTAʹશવಧ͍͍ͯͳ͍Α͏ʹ Έ͑Δɻ

γʔϯ͔ΒActorݕग़ͯ͠ɺ Actor͝ͱʹ࣍ʹͲ͏ͳΔ͔Λ ༧ଌˠMessage PassingΛ܁Γฦ͢ ͜ΕʹΑΓಈ࡞༧ଌਫ਼౓Λ޲্ɻ

͋ͱͰಡΉɻ ಛ௃ྔΛ෼཭͢Δ࿩ɻ ஶऀෆࡏɻ

Multi-label classiﬁcationͰɺ֤ଐੑͷ αϯϓϧ਺ͷInbalanceΛௐ੔͢ΔLossΛఏҊ

Region Proposal Network͕੾Γग़͠ ֤ۣͨܗʹରͯ͠Adv. trainingͰ Domain AdaptationΛ͔͚͍ͯΔͬΆ ͍

λΠτϧΛΈͯԿ͔ͱࢥͬ ͕ͨɺࠨଆͷྻͷ໰୊ઃఆ ΛݟΔʹ Open-set໰୊ͷख๏ͬΆ ͍ɻ

ΊͬͪΌݟΒΕͯͨ

୯Ұը૾ͷΈ͔Βɺ UnsupervisedͰ ಈ͍͍ͯΔ෺ମΛݕग़͢Δख๏ɻ Ͳ͏΋ɺγʔϯͷ͏ͪɺ͔̍ͭ͠ ग़ྗ͠ͳͦ͞͏ͩͬͨͷͰ ৄࡉ͸εΩοϓ

γΣΠϓಛ௃ͱ࢟੎ಛ௃Λ ൈ͖ग़ͯ͠ɺ਽ܗͷ ʮ෰Λணͨਓ෺ʯϞσϧΛ ೖྗ͢Δͱɺணͤସ͕͑Ͱ͖ Δʁ

2Dͷ࢟੎ਪఆx2ຕʹରͯ͠ɺ epipolarͰ3࣍ݩΛ෮ݩ͠ɺ1ຕ͔Β 3Dͷ࢟੎Λग़ྗͰ͖ΔNNΛผ్ ֶश=self supervised.

LSTMʹ͔͚ΔͷͰ͸ͳ͘ɺ ஷΊ·͍ͬͯ͑͘΍ͱؔ਺ʹ͔͚ Δʢؔ਺ͷৄࡉ͸ෆ໌ʣ Epic-Kitchenͷ݁ՌΛݟΔͱ ͘͢͝ޮ͘ɺͱ͍͏ҹ৅͸ ͋·Γͳ͍͔΋ɻ ΋ͬͱଞʹํ๏͕͋Γͦ͏ ڞஶऀ͸߽՚ɻ

ະདྷ༧ଌͷͰ͖ͳ͍ͱ͜Ζ= Eventͷ੾Ε໨ͱ͢Δɻ લ͔Βࢲ͕͍͍ͬͯΔख๏ɻ ·͊ɺ͋Δఔ౓͸Ͱ͖ΔΑ͏ʹ ࢥ͑Δ͕ͦͷઌ͕໰୊ͩͱࢥ ͏ɻ

How to Do 100MΈ͍ͨͳ ͷɻ.͚ͩͲ

LSTMͰ1ϑϨʔϜग़ྗɺ ͦͷϑϨʔϜΛઌ಄ͱͯ͠ɺ ٯ޲͖ͷLSTMΛֶश͠ɺ ઌ಄ϑϨʔϜΛੜ੒͢Δ Cycle GANɻͳ͔ͥMSE͕ ͕͍͋ͬͯΔɻ ࣭໰͕ͨ͠ɺߟ͍͑ͯͳ͔ͬ ͨΒ͘͠ɺ͔֬ʹͳΜͰͩΖ ͏ͱஶऀ͕೰ΜͰ͍ͨ...

Self-supervised Learning͕ AlexNetҙ֎Ͱ΋ͪΌΜͱಈ ͘ͷ͔Λௐ΂ͨ࿦จɻ Take Home Message͕وॏ

Text > Image > Text ͷCycleͷ ΈGANΛద༻ͯ͠ɺText-to- imageͷม׵࣌ͷ৘ใଛࣦΛݮ Βͨ͠ɻ

Yale SongͷൃදɻDiversity Lossͱ͔͸ࣅͨΑ ͏ͳͷ͸͋Δ͸ͣɺΈ͍ͨͳ͜ͱΛ͍͍ͬͯ ͨɻ

Ranjay Krishnaͷൃදɻͪ͜Β͸ Θ͔Γ΍͍͢ɻ ࣭໰จΛੜ੒͢Δ΋ͷΛֶशɻ 1. ը૾ͱਖ਼ղΛೖྗͱ࣭ͯ͠໰จ Λੜ੒ɻ 2. (ೖྗʹਖ਼ղ͕͋Δͱ࣮༻ੑ͕ͳ ͍ͷͰ)ਖ਼ղˠਖ਼ղΧςΰϦʹೖΕ
ସ͑ͨωοτϫʔΫͰ΋ɺಉ͡ಛ௃ ͕ग़ྗ͞ΕΔΑ͏ʹֶशɻ

Knowledge GraphΛೖΕͯ HOIͷݕग़Λݡ͘͢Δख๏

3D point cloud͔Βͷ ఺ͷඪຊநग़Λϝλֶश

͋Μ·Γ৽نੑ͕Α͘Θ ͔Βͳ͍??

JigsawΛ࢖ͬͯෳ਺υϝ Πϯͷը૾Ͱֶश͢Δ ͱɺDomain Generalization(PACS)Ͱ SOTA͕ͰΔ... ҰԠɺҰ͚ͭͩτϦοΫ ͕͋ͬͯɺग़ྗϕΫτϧ ͷΤϯτϩϐʔΛ௿͘͢ ΔΑ͏ʹɺͭ·Γɺৗʹ ֬৴Λ΋ͬͯ౴͑ΔΑ͏
ͳLoss͸௥Ճ͍ͯ͠Δͱ ͷ͜ͱɻ

Target Domain͕ɺ࣮ࡍʹ͸(ະ ஌ͷ)ෳ਺υϝΠϯͷू߹ʹͳ ͍ͬͯΔ৔߹Λߟ͑ɺTarget sub-domainͷਪఆΛ(Ϋϥελ ϦϯάͰ΍Γͳ͕Β)Α͋͘Δ UDAΛ͢Δख๏ɻ ୯ʹಛ௃ྔΛΫϥελϦϯά͢ ΔͱΧςΰϦ͝ͱͷΫϥελ͕ Ͱ͖Δةݥ͕ߴ͍ͷͰɺݩͷը
૾ͱɺಛ௃ྔΛ߹Θͤͨ΋ͷʹ ͍ͨͯ͠ΫϥελϦϯάΛ͢Δ ͱͷ͜ͱɻ

ֶशσʔλ͕Ұ༷෼෍ʹͳΔΑ͏ ͳAdversarial TrainingΛͯ͠ɺҰ ༷෼෍ʹ৐Βͳ͍΋ͷΛɺHard Negativeͱͯ͠ݕग़͍ͯ͠Δɻ

෺ମࣝผͱಈ࡞ࣝผΛֶशͤ͞Δ͜ͱͰɺ ෺ମۣܗΛݕग़͢ΔωοτϫʔΫΛֶशɻ ͜Εͦ͜ɺFirst Person VisionͰطʹ͋Δɻ

AEͷLatent Featureʹରͯ͠ ಛ௃্ۭؒͷڑ཭ʹج͍ͮͯ ҟৗݕ஌͢Δͱɺ্ख͘Open- Set໰୊͕ղ͚Δɺͱ͍͏࿩ɻ ౦େͷݚڀɻ

ैདྷͷSpectral Net͕୯ʹ Siamese NetworkͰϓϨτ Ϩʔχϯά͍ͯͨ͠෦෼Λ վળɻ

ࣗಈ຋༁ͷSOTAʹͳͬͨͷͱಉ͡Ͱɺ image - text ͷCycle-GANΛֶशɻ

Star-GANͰ͸ม׵͸1:1ɻ͜ͷख๏͸ ಉ͡ର৅ͷෳ਺υϝΠϯͷσʔλΛೖྗͱ ͯ͠ɺλʔήοτυϝΠϯͷσʔλΛੜ੒ Ͱ͖ΔΑ͏ʹCycle Consistency LossΛ গ͠޻෉ɻ

Conditional GANͳͲͷ conditionʹϊΠζ͕͋Δͱ͠ ͯɺͲ͏Fix͢Δ͔ɻ ֶश࣌ʹಉׂ͡߹ͷϊΠζΛࡌͤ Δɻ ஶऀʹΑΕ͹ɺϓϥϚΠ0.2͘Β ͍ͷޡࠩ͸଱͑Δɻಉ༷ʹϥϕ ϧʹϊΠζͷͳ͍σʔλʹରͯ͠ ख๏Λద༻ͯ͠΋ͦ͜·ͰѱӨ
ڹ͸ͳ͍ͱͷ͜ͱɻ ࿦จதʹσʔλ͋Γ??

CVPR2019 参加速報本会議1日目 / CVPR2019 Personal Memo: ...

CVPR2019 参加速報本会議1日目 / CVPR2019 Personal Memo: Day 1

Atsushi

More Decks by Atsushi

Other Decks in Technology

Featured

Transcript

CVPR2019 ຊձٞॳ೔ ଎ใ

ಉҰ෺ମผ࢟੎ͷ2ͭͷಛ௃͕Ұக͢Δ Α͏Siamese LossΛ͔͚ͭͭɺޓ͍Λઢ ܗม׵͢Δͱผ࢟੎ͷsegmentΛநग़Ͱ ͖ΔΑ͏ʹֶशˠະ஌෺ମͰCoSeg͕Ͱ ͖ΔΑ͏ʹͳΔɻ

؆୯ͳαϯϓϧ͔ΒঃʑʹDA͢Δ ͱͪΐͬͱਫ਼౓͕͋Δɻ SOTAʹશવಧ͍͍ͯͳ͍Α͏ʹ Έ͑Δɻ

γʔϯ͔ΒActorݕग़ͯ͠ɺ Actor͝ͱʹ࣍ʹͲ͏ͳΔ͔Λ ༧ଌˠMessage PassingΛ܁Γฦ͢ ͜ΕʹΑΓಈ࡞༧ଌਫ਼౓Λ޲্ɻ

͋ͱͰಡΉɻ ಛ௃ྔΛ෼཭͢Δ࿩ɻ ஶऀෆࡏɻ

Multi-label classiﬁcationͰɺ֤ଐੑͷ αϯϓϧ਺ͷInbalanceΛௐ੔͢ΔLossΛఏҊ

Region Proposal Network͕੾Γग़͠ ֤ۣͨܗʹରͯ͠Adv. trainingͰ Domain AdaptationΛ͔͚͍ͯΔͬΆ ͍

λΠτϧΛΈͯԿ͔ͱࢥͬ ͕ͨɺࠨଆͷྻͷ໰୊ઃఆ ΛݟΔʹ Open-set໰୊ͷख๏ͬΆ ͍ɻ

ΊͬͪΌݟΒΕͯͨ

୯Ұը૾ͷΈ͔Βɺ UnsupervisedͰ ಈ͍͍ͯΔ෺ମΛݕग़͢Δख๏ɻ Ͳ͏΋ɺγʔϯͷ͏ͪɺ͔̍ͭ͠ ग़ྗ͠ͳͦ͞͏ͩͬͨͷͰ ৄࡉ͸εΩοϓ

γΣΠϓಛ௃ͱ࢟੎ಛ௃Λ ൈ͖ग़ͯ͠ɺ਽ܗͷ ʮ෰Λணͨਓ෺ʯϞσϧΛ ೖྗ͢Δͱɺணͤସ͕͑Ͱ͖ Δʁ

2Dͷ࢟੎ਪఆx2ຕʹରͯ͠ɺ epipolarͰ3࣍ݩΛ෮ݩ͠ɺ1ຕ͔Β 3Dͷ࢟੎Λग़ྗͰ͖ΔNNΛผ్ ֶश=self supervised.

LSTMʹ͔͚ΔͷͰ͸ͳ͘ɺ ஷΊ·͍ͬͯ͑͘΍ͱؔ਺ʹ͔͚ Δʢؔ਺ͷৄࡉ͸ෆ໌ʣ Epic-Kitchenͷ݁ՌΛݟΔͱ ͘͢͝ޮ͘ɺͱ͍͏ҹ৅͸ ͋·Γͳ͍͔΋ɻ ΋ͬͱଞʹํ๏͕͋Γͦ͏ ڞஶऀ͸߽՚ɻ

ະདྷ༧ଌͷͰ͖ͳ͍ͱ͜Ζ= Eventͷ੾Ε໨ͱ͢Δɻ લ͔Βࢲ͕͍͍ͬͯΔख๏ɻ ·͊ɺ͋Δఔ౓͸Ͱ͖ΔΑ͏ʹ ࢥ͑Δ͕ͦͷઌ͕໰୊ͩͱࢥ ͏ɻ

How to Do 100MΈ͍ͨͳ ͷɻ.͚ͩͲ

LSTMͰ1ϑϨʔϜग़ྗɺ ͦͷϑϨʔϜΛઌ಄ͱͯ͠ɺ ٯ޲͖ͷLSTMΛֶश͠ɺ ઌ಄ϑϨʔϜΛੜ੒͢Δ Cycle GANɻͳ͔ͥMSE͕ ͕͍͋ͬͯΔɻ ࣭໰͕ͨ͠ɺߟ͍͑ͯͳ͔ͬ ͨΒ͘͠ɺ͔֬ʹͳΜͰͩΖ ͏ͱஶऀ͕೰ΜͰ͍ͨ...

Self-supervised Learning͕ AlexNetҙ֎Ͱ΋ͪΌΜͱಈ ͘ͷ͔Λௐ΂ͨ࿦จɻ Take Home Message͕وॏ

Text > Image > Text ͷCycleͷ ΈGANΛద༻ͯ͠ɺText-to- imageͷม׵࣌ͷ৘ใଛࣦΛݮ Βͨ͠ɻ

Yale SongͷൃදɻDiversity Lossͱ͔͸ࣅͨΑ ͏ͳͷ͸͋Δ͸ͣɺΈ͍ͨͳ͜ͱΛ͍͍ͬͯ ͨɻ

Ranjay Krishnaͷൃදɻͪ͜Β͸ Θ͔Γ΍͍͢ɻ ࣭໰จΛੜ੒͢Δ΋ͷΛֶशɻ 1. ը૾ͱਖ਼ղΛೖྗͱ࣭ͯ͠໰จ Λੜ੒ɻ 2. (ೖྗʹਖ਼ղ͕͋Δͱ࣮༻ੑ͕ͳ ͍ͷͰ)ਖ਼ղˠਖ਼ղΧςΰϦʹೖΕ

Knowledge GraphΛೖΕͯ HOIͷݕग़Λݡ͘͢Δख๏

3D point cloud͔Βͷ ఺ͷඪຊநग़Λϝλֶश

͋Μ·Γ৽نੑ͕Α͘Θ ͔Βͳ͍??

JigsawΛ࢖ͬͯෳ਺υϝ Πϯͷը૾Ͱֶश͢Δ ͱɺDomain Generalization(PACS)Ͱ SOTA͕ͰΔ... ҰԠɺҰ͚ͭͩτϦοΫ ͕͋ͬͯɺग़ྗϕΫτϧ ͷΤϯτϩϐʔΛ௿͘͢ ΔΑ͏ʹɺͭ·Γɺৗʹ ֬৴Λ΋ͬͯ౴͑ΔΑ͏

Target Domain͕ɺ࣮ࡍʹ͸(ະ ஌ͷ)ෳ਺υϝΠϯͷू߹ʹͳ ͍ͬͯΔ৔߹Λߟ͑ɺTarget sub-domainͷਪఆΛ(Ϋϥελ ϦϯάͰ΍Γͳ͕Β)Α͋͘Δ UDAΛ͢Δख๏ɻ ୯ʹಛ௃ྔΛΫϥελϦϯά͢ ΔͱΧςΰϦ͝ͱͷΫϥελ͕ Ͱ͖Δةݥ͕ߴ͍ͷͰɺݩͷը

ֶशσʔλ͕Ұ༷෼෍ʹͳΔΑ͏ ͳAdversarial TrainingΛͯ͠ɺҰ ༷෼෍ʹ৐Βͳ͍΋ͷΛɺHard Negativeͱͯ͠ݕग़͍ͯ͠Δɻ

෺ମࣝผͱಈ࡞ࣝผΛֶशͤ͞Δ͜ͱͰɺ ෺ମۣܗΛݕग़͢ΔωοτϫʔΫΛֶशɻ ͜Εͦ͜ɺFirst Person VisionͰطʹ͋Δɻ

AEͷLatent Featureʹରͯ͠ ಛ௃্ۭؒͷڑ཭ʹج͍ͮͯ ҟৗݕ஌͢Δͱɺ্ख͘Open- Set໰୊͕ղ͚Δɺͱ͍͏࿩ɻ ౦େͷݚڀɻ

ैདྷͷSpectral Net͕୯ʹ Siamese NetworkͰϓϨτ Ϩʔχϯά͍ͯͨ͠෦෼Λ վળɻ

ࣗಈ຋༁ͷSOTAʹͳͬͨͷͱಉ͡Ͱɺ image - text ͷCycle-GANΛֶशɻ

Star-GANͰ͸ม׵͸1:1ɻ͜ͷख๏͸ ಉ͡ର৅ͷෳ਺υϝΠϯͷσʔλΛೖྗͱ ͯ͠ɺλʔήοτυϝΠϯͷσʔλΛੜ੒ Ͱ͖ΔΑ͏ʹCycle Consistency LossΛ গ͠޻෉ɻ

Conditional GANͳͲͷ conditionʹϊΠζ͕͋Δͱ͠ ͯɺͲ͏Fix͢Δ͔ɻ ֶश࣌ʹಉׂ͡߹ͷϊΠζΛࡌͤ Δɻ ஶऀʹΑΕ͹ɺϓϥϚΠ0.2͘Β ͍ͷޡࠩ͸଱͑Δɻಉ༷ʹϥϕ ϧʹϊΠζͷͳ͍σʔλʹରͯ͠ ख๏Λద༻ͯ͠΋ͦ͜·ͰѱӨ

CVPR2019 参加速報 本会議1日目 / CVPR2019 Personal Memo: ...

CVPR2019 参加速報 本会議1日目 / CVPR2019 Personal Memo: Day 1

More Decks by Atsushi

Other Decks in Technology

Featured

Transcript

CVPR2019 参加速報本会議1日目 / CVPR2019 Personal Memo: ...

CVPR2019 参加速報本会議1日目 / CVPR2019 Personal Memo: Day 1