【ICML読み会】Unsupervised Deep Embedding for Clustering Analysis

ICML2016࿦จ঺հ Unsupervised Deep Embedding for Clustering Analysis Ross Girshick Jungian
Xie Ali Farhadi University of Washington Facebook AI Research University of Washington ൃදऀ ਅ໦༐ਓ ಸྑઌ୺Պֶٕज़େֶӃେֶ ৘ใՊֶݚڀՊ ത࢜ޙظ՝ఔ ஌ೳίϛϡχέʔγϣϯݚڀࣨ 2016/07/16 @NAIST

3ߦͰཁ໿ • ର৅ɿݹయతͳΫϥελϦϯά໰୊ • ख๏ɿਂ૚ֶशΛར༻ͨ࣍͠ݩ࡟ݮύ  ϥϝλͱΫϥελϦϯάͷಉ࣌  ࠷దԽ • ݁Ռɿैདྷख๏ΑΓ΋ߴ͍ਫ਼౓ɼ୹͍  ܭࢉ࣌ؒΛ࣮ݱ

ΫϥελϦϯάͷؔ࿈ݚڀ • k-means ٴͼ ࠞ߹ਖ਼ن෼෍Ϟσϧ(GMM) • ೖྗͷ࣍ݩ͕ߴ͍ͱࣦഊ͠΍͍͢ • ࣍ݩ࡟ݮͱΫϥελϦϯάΛಉ࣌ʹߦ͏ख๏ •
௿࣍ݩۭؒʹࣸ૾ɼࣸ૾ͨ͠ઌͰΫϥελϦϯά • ैདྷख๏͸ઢܗࣸ૾ͷΈ • εϖΫτϥϧɾΫϥελϦϯά • σʔλͷάϥϑߏ଄Λར༻͢Δख๏ • k-meansΑΓྑ͍݁ՌʹͳΔ͜ͱ͕ଟ͍ • ܭࢉྔ͕αϯϓϧ਺ͷ̎৐·ͨ͸̐৐ʹൺྫ

ه߸ • σʔλ਺ɿ • σʔλɿ • Ϋϥελͷ਺ʢࣄલʹܾఆʣɿ • ࣸ૾ɿ •
ɹ ͷ࣍ݩ <<< ͷ࣍ݩ • ࣸ૾ͷύϥϝλ ΛDNNͰֶश • ࣸ૾ઌͷσʔλɿ • ηϯτϩΠυʢΫϥελΛ୅ද͢Δ఺ʣɿ n { xi 2 X }n i=1 k zi = f✓( xi) ✓ {zi 2 Z}n i=1 {µj 2 Z}k i=1 zi = f✓( xi) zi = f✓( xi)

ఏҊ๏ͷྲྀΕ ॳظԽ ࣍ݩ࡟ݮ ΫϥελׂΓ౰ͯ KL divergenceܭࢉ ύϥϝλߋ৽

࣍ݩ࡟ݮ • ਂ૚ֶशΛར༻ͨ͠ඇઢܗͳ௿࣍ݩԽࣸ૾ f✓ : X ! Z { xi
2 X }n i=1 zi = • ڭࢣͳֶ͠शͷͨΊɼަ ࠩݕূ๏ʹΑΔϋΠύʔύ ϥϝλͷௐ੔͸Ͱ͖ͳ͍ • ͦͷͨΊɼΑ͘࢖ΘΕΔ ωοτϫʔΫߏ੒Λ࢖༻ • ֤૚ͷ࣍ݩ͸  (input)-500-500-2000-10 • શ݁߹ [van der Maaten, 09]

ΫϥελׂΓ౰ͯ Soft Asignment • ࣸ૾͞Εͨσʔλ ͱηϯτϩΠυ ͷྨࣅ ౓ई౓ (soft assignment) 
            ͸ɼ ͕̹൪໨ͷΫϥελʹೖΔ֬཰ͱͯ͠ ղऍͰ͖Δɽ qij = 1 + kzi µj0 k2/↵ (↵+1)/2 P j0 (1 + kzi µj0 k2/↵) (↵+1)/2 ↵ = 1 {zi 2 Z}n i=1 µj [van der Maaten & Hinton, 08] qij = 1 + kzi µj0 k2/↵ (↵+1)/2 P j0 (1 + kzi µj0 k2/↵) (↵+1)/2 {zi 2 Z}n i=1 • ڭࢣͳֶ͠शʹ͓͍ͯ͸ɼަࠩݕূ๏͸࢖͑ͳ͍ ͨΊɼ ʹݻఆɽ

KLμΠόʔδΣϯεʹΑΔDNNֶश • ࢑ఆతͳׂΓ౰ͯ෼෍ • ໨ඪ෼෍ʢཧ૝తͳΫϥελϦϯάΛߦ͏ͱߟ͑Β ΕΔ෼෍ʣ • PͱQͷKLμΠόʔδΣϯεΛ࠷খԽ͢ΔΑ͏ʹDNN Λֶश •
Pͷઃఆ͕ຊख๏ͷΩϞ

ύϥϝλߋ৽ • DNNͷύϥϝλθ ͱ  ηϯτϩΠυ μj Λߋ৽ • SGDͰߋ৽ (θ͸όοΫϓϩύήʔγϣϯ)

ॳظԽ • DNNͷॳظԽɿ Stacked Auto Encoder Λར༻ • ηϯτϩΠυͷॳظԽɿॳظԽDNNΛར༻ͯ࣍͠ݩ࡟ ݮ͠ɼࣸ૾ઌͰk-means

࣮ݧ • σʔληοτ • ൺֱख๏ • k-means • LDGMI (εϖΫτϥϧɾΫϥελϦϯά)
• SEC (εϖΫτϥϧɾΫϥελϦϯά) • Without back propagation

࣮૷ • Stacked Auto EncoderͷॳظԽ • ฏۉ0ɼඪ४ภࠩ0.01ͷਖ਼ن෼෍Λ࢖ͬͨ ཚ਺ͰॏΈΛॳظԽ • ֤૚͝ͱʹ50000ճ൓෮ʢ20%Dropoutʣ
• Auto EncoderશମͰ100000ճ൓෮ͯ͠ ﬁne tuning (Dropoutແ͠) • ϛχόοναΠζ=256 • ֶश཰=0.1 ←20000൓෮ຖʹ1/10

࣮૷ • ηϯτϩΠυͷॳظԽ • ҟͳΔॳظ஋Ͱ20ճ࣮ߦͯ͠ϕετͳ΋ ͷΛબ୒ • KLμΠόʔδΣϯεͷ࠷খԽ • ֶश཰=0.01
(ݻఆ) • ऩଋ൑ఆ • ΫϥελͷׂΓ౰͕ͯมԽ͢Δσʔλ͕ 0.1%ҎԼʹͳΔ·Ͱ

ධՁج४ • Unsupervised Clustering Accuracy (ACC) • pi ɿਅͷϥϕϧ •
qi ɿΞϧΰϦζϜ͕ग़ྗͨ͠ϥϕϧ • map()ɿϥϕϧ͔ΒΫϥελ΁ͷ࠷దͳϚοϐϯά

݁Ռ • ఏҊ๏͕ϕετͷੑೳ • REUTERSʹ͍ͭͯ • ఏҊ๏ͷֶश࣌ؒ͸30෼ఔ౓ • LDMGIͱSEC͸਺ϲ݄Ҏ্ͷܭࢉ࣌ؒͱςϥ ୯ҐͷϝϞϦ͕ඞཁ

ϋΠύʔύϥϝλʹର͢Δؤ݈ੑ • ҟͳΔ9ͭͷϋΠύʔύϥϝλʢΞχʔϦϯάʣ  ͰੑೳΛൺֱ • ఏҊ๏͸ϋΠύʔύϥϝλͷมಈʹରͯ͠ؤ݈ɼ  ͔ͭσʔληοτʹඇґଘ • ڭࢣͳֶ͠शʹ͓͍ͯ͸ॏཁͳੑ࣭

໨ඪ෼෍Pͷੑ࣭ • qij ͕େ͖΄Ͳ(֬৴౓͕େ͖͍΄Ͳ)ɼޯ഑͕ େ͖͘ͳΔ  ˠP͸๬·͍͠ੑ࣭Λ͍࣋ͬͯΔ

࣍ݩ࡟ݮͷ൓෮࠷దԽʹΑΔޮՌ • t-SNEΛར༻ͨ͠ՄࢹԽ [van der Maaten & Hinton, 08] •
ߋ৽͕ਐΉ΄ͲΫϥελʔͷ෼཭͕໌֬ʹ

Auto EncoderʹΑΔಛ௃நग़ͷޮՌ • Auto EncoderͰಛ௃நग़ˠ֤ΞϧΰϦζϜͰॲཧ • Auto EncoderʹΑΔߩݙ͕େ͖͍

ෆۉҰͳσʔληοτʹର͢Δؤ݈ੑ • αϯϓϧ਺͕࠷খͷΫϥεͷαϯϓϧ਺Λɼ ࠷େͷαϯϓϧ਺ͷΫϥεͷrmin ഒʹઃఆɼ ͦͷଞͷΫϥε͸0.1ͣͭ૿΍͍ͯ͘͠ • ఏҊ๏͸αϯϓϧ਺ͷෆۉҰੑʹରͯ͠ؤ݈

݁࿦ • ఏҊ๏͸ɼਂ૚ֶशΛར༻ͨ࣍͠ݩ࡟ݮʹΑΓΫϥ ελϦϯάͷੑೳΛ޲্ • ࣍ݩ࡟ݮͷύϥϝλͱΫϥελϦϯάͷ݁ՌΛಉ ࣌ʹ࠷దԽ • ΫϥελϦϯά࢑ఆతͳग़ྗͱ໨ඪ෼෍ͱͷKL μΠόʔδΣϯεΛଛࣦؔ਺ͱͯ͠όοΫϓϩύ
ήʔγϣϯ • ैདྷ๏ΑΓߴਫ਼౓͔ͭߴ଎ʢܭࢉ࣌ؒ͸αϯϓϧ਺ ʹରͯ͠ઢܗʹൺྫʣɼσʔληοτඇґଘɼϋΠύʔ ύϥϝλඇґଘɼαϯϓϧ਺ͷෆۉҰੑʹରͯ͠ؤ݈

【ICML読み会】Unsupervised Deep Embedding for Cluste...

【ICML読み会】Unsupervised Deep Embedding for Clustering Analysis

Hayato Maki

More Decks by Hayato Maki

Other Decks in Technology

Featured

Transcript

ICML2016࿦จ঺հ Unsupervised Deep Embedding for Clustering Analysis Ross Girshick Jungian

3ߦͰཁ໿ • ର৅ɿݹయతͳΫϥελϦϯά໰୊ • ख๏ɿਂ૚ֶशΛར༻ͨ࣍͠ݩ࡟ݮύ  ϥϝλͱΫϥελϦϯάͷಉ࣌  ࠷దԽ • ݁Ռɿैདྷख๏ΑΓ΋ߴ͍ਫ਼౓ɼ୹͍  ܭࢉ࣌ؒΛ࣮ݱ

ΫϥελϦϯάͷؔ࿈ݚڀ • k-means ٴͼ ࠞ߹ਖ਼ن෼෍Ϟσϧ(GMM) • ೖྗͷ࣍ݩ͕ߴ͍ͱࣦഊ͠΍͍͢ • ࣍ݩ࡟ݮͱΫϥελϦϯάΛಉ࣌ʹߦ͏ख๏ •

ه߸ • σʔλ਺ɿ • σʔλɿ • Ϋϥελͷ਺ʢࣄલʹܾఆʣɿ • ࣸ૾ɿ •

ఏҊ๏ͷྲྀΕ ॳظԽ ࣍ݩ࡟ݮ ΫϥελׂΓ౰ͯ KL divergenceܭࢉ ύϥϝλߋ৽

࣍ݩ࡟ݮ • ਂ૚ֶशΛར༻ͨ͠ඇઢܗͳ௿࣍ݩԽࣸ૾ f✓ : X ! Z { xi

ΫϥελׂΓ౰ͯ Soft Asignment • ࣸ૾͞Εͨσʔλ ͱηϯτϩΠυ ͷྨࣅ ౓ई౓ (soft assignment)

KLμΠόʔδΣϯεʹΑΔDNNֶश • ࢑ఆతͳׂΓ౰ͯ෼෍ • ໨ඪ෼෍ʢཧ૝తͳΫϥελϦϯάΛߦ͏ͱߟ͑Β ΕΔ෼෍ʣ • PͱQͷKLμΠόʔδΣϯεΛ࠷খԽ͢ΔΑ͏ʹDNN Λֶश •

ύϥϝλߋ৽ • DNNͷύϥϝλθ ͱ  ηϯτϩΠυ μj Λߋ৽ • SGDͰߋ৽ (θ͸όοΫϓϩύήʔγϣϯ)

ॳظԽ • DNNͷॳظԽɿ Stacked Auto Encoder Λར༻ • ηϯτϩΠυͷॳظԽɿॳظԽDNNΛར༻ͯ࣍͠ݩ࡟ ݮ͠ɼࣸ૾ઌͰk-means

࣮ݧ • σʔληοτ • ൺֱख๏ • k-means • LDGMI (εϖΫτϥϧɾΫϥελϦϯά)

࣮૷ • Stacked Auto EncoderͷॳظԽ • ฏۉ0ɼඪ४ภࠩ0.01ͷਖ਼ن෼෍Λ࢖ͬͨ ཚ਺ͰॏΈΛॳظԽ • ֤૚͝ͱʹ50000ճ൓෮ʢ20%Dropoutʣ

࣮૷ • ηϯτϩΠυͷॳظԽ • ҟͳΔॳظ஋Ͱ20ճ࣮ߦͯ͠ϕετͳ΋ ͷΛબ୒ • KLμΠόʔδΣϯεͷ࠷খԽ • ֶश཰=0.01

ධՁج४ • Unsupervised Clustering Accuracy (ACC) • pi ɿਅͷϥϕϧ •

݁Ռ • ఏҊ๏͕ϕετͷੑೳ • REUTERSʹ͍ͭͯ • ఏҊ๏ͷֶश࣌ؒ͸30෼ఔ౓ • LDMGIͱSEC͸਺ϲ݄Ҏ্ͷܭࢉ࣌ؒͱςϥ ୯ҐͷϝϞϦ͕ඞཁ

ϋΠύʔύϥϝλʹର͢Δؤ݈ੑ • ҟͳΔ9ͭͷϋΠύʔύϥϝλʢΞχʔϦϯάʣ  ͰੑೳΛൺֱ • ఏҊ๏͸ϋΠύʔύϥϝλͷมಈʹରͯ͠ؤ݈ɼ  ͔ͭσʔληοτʹඇґଘ • ڭࢣͳֶ͠शʹ͓͍ͯ͸ॏཁͳੑ࣭

໨ඪ෼෍Pͷੑ࣭ • qij ͕େ͖΄Ͳ(֬৴౓͕େ͖͍΄Ͳ)ɼޯ഑͕ େ͖͘ͳΔ  ˠP͸๬·͍͠ੑ࣭Λ͍࣋ͬͯΔ

࣍ݩ࡟ݮͷ൓෮࠷దԽʹΑΔޮՌ • t-SNEΛར༻ͨ͠ՄࢹԽ [van der Maaten & Hinton, 08] •

Auto EncoderʹΑΔಛ௃நग़ͷޮՌ • Auto EncoderͰಛ௃நग़ˠ֤ΞϧΰϦζϜͰॲཧ • Auto EncoderʹΑΔߩݙ͕େ͖͍

ෆۉҰͳσʔληοτʹର͢Δؤ݈ੑ • αϯϓϧ਺͕࠷খͷΫϥεͷαϯϓϧ਺Λɼ ࠷େͷαϯϓϧ਺ͷΫϥεͷrmin ഒʹઃఆɼ ͦͷଞͷΫϥε͸0.1ͣͭ૿΍͍ͯ͘͠ • ఏҊ๏͸αϯϓϧ਺ͷෆۉҰੑʹରͯ͠ؤ݈

݁࿦ • ఏҊ๏͸ɼਂ૚ֶशΛར༻ͨ࣍͠ݩ࡟ݮʹΑΓΫϥ ελϦϯάͷੑೳΛ޲্ • ࣍ݩ࡟ݮͷύϥϝλͱΫϥελϦϯάͷ݁ՌΛಉ ࣌ʹ࠷దԽ • ΫϥελϦϯά࢑ఆతͳग़ྗͱ໨ඪ෼෍ͱͷKL μΠόʔδΣϯεΛଛࣦؔ਺ͱͯ͠όοΫϓϩύ

Ҏ্