Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CVPR2019 参加速報 本会議1日目 / CVPR2019 Personal Memo: ...
Search
Atsushi
June 18, 2019
Technology
0
360
CVPR2019 参加速報 本会議1日目 / CVPR2019 Personal Memo: Day 1
チラシの裏チラシの裏チラシの裏チラシの裏チラシの裏チラシの裏
Atsushi
June 18, 2019
Tweet
Share
More Decks by Atsushi
See All by Atsushi
CVPR2019参加速報 本会議 3日目 / CVPR2019 Personal Memo: Day 3
atsushihashimoto
0
270
CVPR2019参加速報 本会議 2日目 / CVPR2019 Personal Memo: Day 2
atsushihashimoto
0
230
Other Decks in Technology
See All in Technology
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
490
AIエージェントに必要なのはデータではなく文脈だった/ai-agent-context-graph-mybest
jonnojun
1
240
Exadata Fleet Update
oracle4engineer
PRO
0
1.1k
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
290
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.6k
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
210
ブロックテーマ、WordPress でウェブサイトをつくるということ / 2026.02.07 Gifu WordPress Meetup
torounit
0
200
【Ubie】AIを活用した広告アセット「爆速」生成事例 | AI_Ops_Community_Vol.2
yoshiki_0316
1
120
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
480
20260204_Midosuji_Tech
takuyay0ne
1
160
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
330
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
3
220
Featured
See All Featured
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
320
Abbi's Birthday
coloredviolet
1
4.8k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
How to make the Groovebox
asonas
2
1.9k
Designing for Timeless Needs
cassininazir
0
130
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1k
The Pragmatic Product Professional
lauravandoore
37
7.1k
The Curious Case for Waylosing
cassininazir
0
240
Code Reviewing Like a Champion
maltzj
527
40k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
120
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
170
Odyssey Design
rkendrick25
PRO
1
500
Transcript
CVPR2019 ຊձٞॳ ใ
- ࡢ·Ͱͱಉ༷ɺݸਓͷϝϞΛެ։͍ͯ͠ΔΑ͏ͳܗͷͷͰ͢ɻ͋͘·Ͱ ɺͪΒ͠ͷཪతͳѻ͍Ͱ͓ئ͍͠·͢ - ࢲͷཧղͷँΓଟʑ͋Δͱࢥ͍·͢ͷͰ͝༰͍ࣻͩ͘͞ɻ ࠓճ͔Βޱ಄ൃදγϣʔτΦʔϥϧͷΈʹͳΓ·ͨ͠ɻ5ൃදx3݅ຖʹ3ͷ࣭͕ٙ͋Δܗ(ܭ18) ͰਐΜͰ͍͘ܗͰ͢ɻΈΜͳख๏ͷৄࡉ·ͰͤͣɺͪΐͬͱUXͷ͍ܗࣜͩͬͨ=ࣸਅͱͬͨΓϝϞ ͢ΔՋ͕ͳ͔ͬͨͷͰɺࠓճ͕ࣗฉ͍ͨൃදΛϙελʔͷΈʹߜͬͯྻڍɻ
ಉҰମผ࢟ͷ2ͭͷಛ͕Ұக͢Δ Α͏Siamese LossΛ͔͚ͭͭɺޓ͍Λઢ ܗม͢Δͱผ࢟ͷsegmentΛநग़Ͱ ͖ΔΑ͏ʹֶशˠະମͰCoSeg͕Ͱ ͖ΔΑ͏ʹͳΔɻ
؆୯ͳαϯϓϧ͔ΒঃʑʹDA͢Δ ͱͪΐͬͱਫ਼͕͋Δɻ SOTAʹશવಧ͍͍ͯͳ͍Α͏ʹ Έ͑Δɻ
γʔϯ͔ΒActorݕग़ͯ͠ɺ Actor͝ͱʹ࣍ʹͲ͏ͳΔ͔Λ ༧ଌˠMessage PassingΛ܁Γฦ͢ ͜ΕʹΑΓಈ࡞༧ଌਫ਼Λ্ɻ
͋ͱͰಡΉɻ ಛྔΛ͢Δɻ ஶऀෆࡏɻ
Multi-label classificationͰɺ֤ଐੑͷ αϯϓϧͷInbalanceΛௐ͢ΔLossΛఏҊ
Region Proposal Network͕Γग़͠ ֤ۣͨܗʹରͯ͠Adv. trainingͰ Domain AdaptationΛ͔͚͍ͯΔͬΆ ͍
λΠτϧΛΈͯԿ͔ͱࢥͬ ͕ͨɺࠨଆͷྻͷઃఆ ΛݟΔʹ Open-setͷख๏ͬΆ ͍ɻ
ΊͬͪΌݟΒΕͯͨ
୯Ұը૾ͷΈ͔Βɺ UnsupervisedͰ ಈ͍͍ͯΔମΛݕग़͢Δख๏ɻ Ͳ͏ɺγʔϯͷ͏ͪɺ͔̍ͭ͠ ग़ྗ͠ͳͦ͞͏ͩͬͨͷͰ ৄࡉεΩοϓ
γΣΠϓಛͱ࢟ಛΛ ൈ͖ग़ͯ͠ɺܗͷ ʮΛணͨਓʯϞσϧΛ ೖྗ͢Δͱɺணͤସ͕͑Ͱ͖ Δʁ
2Dͷ࢟ਪఆx2ຕʹରͯ͠ɺ epipolarͰ3࣍ݩΛ෮ݩ͠ɺ1ຕ͔Β 3Dͷ࢟Λग़ྗͰ͖ΔNNΛผ్ ֶश=self supervised.
LSTMʹ͔͚ΔͷͰͳ͘ɺ ஷΊ·͍ͬͯ͑͘ͱؔʹ͔͚ Δʢؔͷৄࡉෆ໌ʣ Epic-Kitchenͷ݁ՌΛݟΔͱ ͘͢͝ޮ͘ɺͱ͍͏ҹ ͋·Γͳ͍͔ɻ ͬͱଞʹํ๏͕͋Γͦ͏ ڞஶऀ߽՚ɻ
ະདྷ༧ଌͷͰ͖ͳ͍ͱ͜Ζ= EventͷΕͱ͢Δɻ લ͔Βࢲ͕͍͍ͬͯΔख๏ɻ ·͊ɺ͋ΔఔͰ͖ΔΑ͏ʹ ࢥ͑Δ͕ͦͷઌ͕ͩͱࢥ ͏ɻ
How to Do 100MΈ͍ͨͳ ͷɻ.͚ͩͲ
LSTMͰ1ϑϨʔϜग़ྗɺ ͦͷϑϨʔϜΛઌ಄ͱͯ͠ɺ ٯ͖ͷLSTMΛֶश͠ɺ ઌ಄ϑϨʔϜΛੜ͢Δ Cycle GANɻͳ͔ͥMSE͕ ͕͍͋ͬͯΔɻ ࣭͕ͨ͠ɺߟ͍͑ͯͳ͔ͬ ͨΒ͘͠ɺ͔֬ʹͳΜͰͩΖ ͏ͱஶऀ͕ΜͰ͍ͨ...
Self-supervised Learning͕ AlexNetҙ֎ͰͪΌΜͱಈ ͘ͷ͔Λௐͨจɻ Take Home Message͕وॏ
Text > Image > Text ͷCycleͷ ΈGANΛద༻ͯ͠ɺText-to- imageͷม࣌ͷใଛࣦΛݮ Βͨ͠ɻ
Yale SongͷൃදɻDiversity Lossͱ͔ࣅͨΑ ͏ͳͷ͋ΔͣɺΈ͍ͨͳ͜ͱΛ͍͍ͬͯ ͨɻ
Ranjay Krishnaͷൃදɻͪ͜Β Θ͔Γ͍͢ɻ ࣭จΛੜ͢ΔͷΛֶशɻ 1. ը૾ͱਖ਼ղΛೖྗͱ࣭ͯ͠จ Λੜɻ 2. (ೖྗʹਖ਼ղ͕͋Δͱ࣮༻ੑ͕ͳ ͍ͷͰ)ਖ਼ղˠਖ਼ղΧςΰϦʹೖΕ
ସ͑ͨωοτϫʔΫͰɺಉ͡ಛ ͕ग़ྗ͞ΕΔΑ͏ʹֶशɻ
Knowledge GraphΛೖΕͯ HOIͷݕग़Λݡ͘͢Δख๏
3D point cloud͔Βͷ ͷඪຊநग़Λϝλֶश
͋Μ·Γ৽نੑ͕Α͘Θ ͔Βͳ͍??
JigsawΛͬͯෳυϝ Πϯͷը૾Ͱֶश͢Δ ͱɺDomain Generalization(PACS)Ͱ SOTA͕ͰΔ... ҰԠɺҰ͚ͭͩτϦοΫ ͕͋ͬͯɺग़ྗϕΫτϧ ͷΤϯτϩϐʔΛ͘͢ ΔΑ͏ʹɺͭ·Γɺৗʹ ֬৴Λͬͯ͑ΔΑ͏
ͳLossՃ͍ͯ͠Δͱ ͷ͜ͱɻ
Target Domain͕ɺ࣮ࡍʹ(ະ ͷ)ෳυϝΠϯͷू߹ʹͳ ͍ͬͯΔ߹Λߟ͑ɺTarget sub-domainͷਪఆΛ(Ϋϥελ ϦϯάͰΓͳ͕Β)Α͋͘Δ UDAΛ͢Δख๏ɻ ୯ʹಛྔΛΫϥελϦϯά͢ ΔͱΧςΰϦ͝ͱͷΫϥελ͕ Ͱ͖Δةݥ͕ߴ͍ͷͰɺݩͷը
૾ͱɺಛྔΛ߹Θͤͨͷʹ ͍ͨͯ͠ΫϥελϦϯάΛ͢Δ ͱͷ͜ͱɻ
ֶशσʔλ͕Ұ༷ʹͳΔΑ͏ ͳAdversarial TrainingΛͯ͠ɺҰ ༷ʹΒͳ͍ͷΛɺHard Negativeͱͯ͠ݕग़͍ͯ͠Δɻ
ମࣝผͱಈ࡞ࣝผΛֶशͤ͞Δ͜ͱͰɺ ମۣܗΛݕग़͢ΔωοτϫʔΫΛֶशɻ ͜Εͦ͜ɺFirst Person VisionͰطʹ͋Δɻ
None
AEͷLatent Featureʹରͯ͠ ಛ্ۭؒͷڑʹج͍ͮͯ ҟৗݕ͢Δͱɺ্ख͘Open- Set͕ղ͚Δɺͱ͍͏ɻ ౦େͷݚڀɻ
ैདྷͷSpectral Net͕୯ʹ Siamese NetworkͰϓϨτ Ϩʔχϯά͍ͯͨ͠෦Λ վળɻ
ࣗಈ༁ͷSOTAʹͳͬͨͷͱಉ͡Ͱɺ image - text ͷCycle-GANΛֶशɻ
Star-GANͰม1:1ɻ͜ͷख๏ ಉ͡ରͷෳυϝΠϯͷσʔλΛೖྗͱ ͯ͠ɺλʔήοτυϝΠϯͷσʔλΛੜ Ͱ͖ΔΑ͏ʹCycle Consistency LossΛ গ͠ɻ
Conditional GANͳͲͷ conditionʹϊΠζ͕͋Δͱ͠ ͯɺͲ͏Fix͢Δ͔ɻ ֶश࣌ʹಉׂ͡߹ͷϊΠζΛࡌͤ Δɻ ஶऀʹΑΕɺϓϥϚΠ0.2͘Β ͍ͷޡࠩ͑Δɻಉ༷ʹϥϕ ϧʹϊΠζͷͳ͍σʔλʹରͯ͠ ख๏Λద༻ͯͦ͜͠·ͰѱӨ
ڹͳ͍ͱͷ͜ͱɻ จதʹσʔλ͋Γ??
None