Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DSB.pdf
Search
yujiariyasu
March 10, 2020
Programming
37k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
DSB.pdf
yujiariyasu
March 10, 2020
Other Decks in Programming
See All in Programming
ふつうのFeature Flag実践入門
irof
8
4k
その問い、本当に正しいですか?AI時代のエンジニアに必要な哲学と認知科学 / ai-philosophy-cognitive-science
minodriven
11
5.8k
TSKaigi Night Talks 2026_TypeScriptでサプライチェーンの整合性を型に閉じ込める
geekplus_tech
0
400
ユニットテストの先へ:テスト技法で要求・仕様を整理するJava開発実践 / Beyond_Unit_Testing_Practical_Java_Development_Techniques_for_Organizing_Requirements_and_Specifications
shimashima35
0
410
TypeScript+Orvalで実現する型安全かつ堅牢でスケーラブルなマルチチャネル通知基盤 / TSKaigi Night talks ~after conference~
d0riven
0
350
メソッドのジェネリクスでGoの夢は広がるか? / Kyoto.go #65
utgwkk
3
840
Datadog × OpenTelemetry 入門と実践のあいだ
kn_to_maxpno
1
160
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
21
6.7k
ローカルLLMでどこまでコードが書けるか -拡張版 / How much code can be written on a local LLM Extended
kishida
11
4.3k
jQueryをバージョンアップする前に使いたいjQuery Migrate
matsuo_atsushi
0
560
フロントエンドとバックエンドで「1文字」を揃えよう
youkidearitai
PRO
0
710
Honoでのサプライチェーン侵害対策 〜 3つのライブラリに学ぶ
yusukebe
6
1.3k
Featured
See All Featured
Exploring anti-patterns in Rails
aemeredith
3
410
The Curse of the Amulet
leimatthew05
1
13k
Navigating Weather and Climate Data
rabernat
0
220
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.5k
Statistics for Hackers
jakevdp
799
230k
How GitHub (no longer) Works
holman
316
150k
How to Think Like a Performance Engineer
csswizardry
28
2.7k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
GraphQLとの向き合い方2022年版
quramy
50
15k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
200
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
160
Transcript
DSB 51st solution
❍Agenda 1. ࣗݾհ 2. ࢀՃελϯεʹ͍ͭͯ 3. ԿΛ͔ͨ͠ 4. ࠷ऴతͳղ๏ 5.
ল 6. ࠓޙ
❍ࣗݾհ ɾtwitter: aryyyyy ɾWebܥΤϯδχΞɻGoͱRuby ɾΤϯδχΞͷલόϯυϚϯͯ͠·ͨ͠ ɾCourseraଞͰ3ϲ݄΄Ͳษڧͯ͠kaggleೖ ɾͪΌΜͱࢀՃͨ͠ͷDSB͕ॳ(େมͩͬͨʂ) ɾ1݄͔Βٳ৬ͯ͠1000࣌ؒษڧ͔ͯ͠Βɺ ػցֶशΤϯδχΞʹJobνΣϯδ༧ఆ
❍ࢀՃελϯεʹ͍ͭͯ ɾΛୈҰʹߟ͑Δ → ͋Μ·ΓΤά͍probingʹ࣌ؒΛΘͳ͍ ɾkernelͲΜͲΜύΫΔɻ →kernelͱmerge͍͢͠Α͏ʹɺૄ݁߹ͳίʔυΛॻ͘ ɾίʔυͷࢿ࢈ஷΊͳ͍ → ࠷ॳͷ͏ͪຖճεΫϥον͍ͨ͠ ɾಛྔ࡞Γͷ࿅शΛ͢Δ
→ pandasʹ׳ΕΔͨΊʹಛʹؤுΓ͔ͨͬͨɻ
❍ԿΛ͔ͨ͠ • ͱΓ͋͑ͣEDA • υϝΠϯࣝೖΕΔ • KernelͱDiscussionͷΞΠσΞجຊશ෦ࢼ͢ • Kaggleຊʹॻ͍ͯ͋Δ͜ͱશ෦ࢼ͢ •
ࡉ͔͍σʔλΛ͘·ͳ͘ݟΔ(۩ମతͳΓํޙड़) • ࿅श݉Ͷͯͱʹ͔͘ࢁಛྔ࡞Δ(3000ݸҎ্) • Feature Selection • CVઓུ • Data Augmentation(test શ෦͏ͷͱɺtrainͷpan balance͏ͷ ͷΈࢼͨ͠)
❍ࡉ͔͍σʔλΛ͘·ͳ͘ݟΔ ྫ͑ɺ࣮ࡍʹήʔϜΛϓϨΠͭͭ͠ɺҎԼΛӈʹεΫϩʔϧ͍ͯ͘͠ɻ ԿਓΔͱɺ৭Μͳύλʔϯ͕ݟ͑ͯ͘ΔͱڞʹɺมΘͬͨߦಈΛऔΔࢠݟ͑ͯ͘Δɻ ͦͷลΓΛಛྔʹམͱ͠ࠐΜͩɻ
❍ಛྔʹ͍ͭͯ • ಉλΠτϧʹؔ͢ΔɺͲΕ͘Β͍લʹϓϨΠ͔ͨ͠ɺϨίʔυͳͲͳͲɻͨ͘͞Μ • ͦͷଞήʔϜλΠτϧ(23ݸ͘Β͍)ʹ্هΛద༻ • Worldબεϐʔυ • 'type', ‘event_code'ͳͲͳͲͷϢχʔΫ
• clipΛεΩοϓ͢Δࢠ͔Ͳ͏͔ɺͲΕ͘Β͍ͷׂ߹ݟ͔ͨ • happycamel, scrubadub, bubble_bathͳͲɺΫϦΞʹஈ֊͕͋Δͷɺқ͕૿͍ͯ͠ ͘ͷʹؔͯ͠ɺͲ͜·ͰΫϦΞ͔ͨ͠ɺͦΕͧΕͷਖ਼ղͷׂ߹ͳͲ • level, round, missͳͲʹؔͯ͠ • installޙɺ࠷ॳʹ๚ΕͨλΠτϧɻԦಓͷ3λΠτϧ͔൱͔ͳͲɻੜޙtarget encodingɻ • Ұ൪࠷ۙ๚ΕͨgameͷλΠτϧʹؔ͢Δͷ • ಉ࣌ؒ͡ଳʹߜͬͯ৭ʑͳಛΛ(ͱͷ۠ผΛ͔ͨͬͨ͠) • ্هͷதͰॏཁͦ͏ͳͷweightedੜ • ΫϥελϦϯά(ͲͷΫϥελʹଐ͔͢ɺΫϥελͷॏ৺͔Βͷڑ) • ্هͷ2~3000ఔͷಛͷத͔Βॏཁͦ͏ͳͷΛֻ͚߹ΘͤΔɻ10ສҎ্ੜ
❍࠷ऴతͳղ๏1 ʲfeatureʳ ɾͦͷޙGCPͰɺ800ݸఔΛϥϯμϜͰબΜͰ10ճͷฏۉCVΛܭࢉ͢Δ͜ͱΛઍ ճ΄Ͳ܁Γฦͯ͠ɺ1൪͍͍800ݸͷΈ߹ΘͤΛ୳ͨ͠ɻ໌Β͔ʹѱ͍Έ߹Θͤ ࢬΓ͢ΔͳͲͨ͠ɻfeature selectionͷࡍCVtruncatedͳͷΛ༻ɻ ɾ500ݸɺ300ݸͰಉ༷ʹͯ͠ɺ࠷ޙʹࠞͥͨɻͱʹ͔͘ಛྔબ͕͏·͍͔͘ ͳ͔ͬͨΑ͏ʹײ͍ͯͨ͡ͷͰɺۤͷࡦͰଟ༷ੑΛ࣋ͨͤͨɻ(݁ہҙຯແ͠ɻ 800ݸ͚ͩͩͱTOP1%ͩͬͨ) ʲvalidationʳ
ɾCVStratified Group KFoldɻ ɾ࠷ऴతͳֶशͷࡍCVtruncateͤͣɻPLBܹ͘͠Լ͕ͬͨͷͰɻ(truncateͨ͠ํ ͕privateྑ͔ͬͨ)
❍࠷ऴతͳղ๏2 ʲmodelʳ ɾLightGBMͱXgboostͱNNΛγϯϓϧͳΞϯαϯϒϧɻ6:2:2 ͰࠞͥͨɻLightGBMͱXgboostಉ͡ಛྔɻNNkernelʹগ ͠ಛྔ͚ͨͩ͠ͷͷɻNN୯ମͩͱPLB0.520͘Β͍ɻࠞ ͥΔ͔໎͕ͬͨɺPLBͷ্͕͋ͬͨͷͰ2ׂ͚ͩೖΕͨɻ ʲthresholdsʳ ɾᮢશ͘Θ͔Βͳ͔ͬͨͷͰɺ2αϒ͜͜Ͱͬͨɻkernel Ͱྲྀߦ͍ͬͯͨɺʹै͏ͷͱoptimizerͰܭࢉ͢Δͷɻ optimizerͰܭࢉ͢Δͷ͕ྑ͔͕ͬͨɺ͋·Γࠩͳ͔ͬͨɻ
❍ল ɾςετॻ͍ͨํָ͕͔ͩͬͨ → 1ϲ݄Ҏ্ͱ͔ίϛοτ͢ΔΜͩͬͨΒɺςετॻ͍ͨํ͕݁ہ࣌ؒॖʹͳΓͦ͏ ɾத్ʹprobingͯ͠AugumentationࣙΊͯ͠·ͬͨ → private testΛͨ͠CVΛprobͨ͠ΒԼ͕͍ͬͯͨͷͰࣙΊ͕ͨɺ͠ํͷ͕ॆͰͳ͔ͬͨ ɾ৭ΜͳཤྺΛϑΝΠϧͰ͓͚ͯ͠Α͔ͬͨ →
ΈΜͳͬͯ·͢ʁ001_features.pyΈ͍ͨͳͭͱ͔࣮ݧ݁ՌͷཤྺͷςΩετ͢ͱ͔… ɾPLBʹৼΓճ͞Εͯ͠·ͬͨɻ(DiscussionνʔϜϚʔδͰ݁ߏΈΜͳPLBॏཁࢹ͍ͯͨ͠ͷͰ…) → DiscussionͰɺڧ͍ਓPLBͯʹͳΒͳ͍ͱݴ͍ͬͯΔ͕͋ͬͨΑ͏ʹࢥ͏ɻؒҧͬͨҙݟ ͋Δͱೝ͖ࣝͩͬͨ͢ ɾFeature Selection͕ͱʹ͔͘͏·͍͔͘ͳ͔ͬͨ(Α͏ʹݟ͑ͨ) →͜ΕPLBΛաʹࢀߟʹͯ͠͠·ͬͨͨΊɻࢀߟʹͳΒͳ͍ίϯϖ͋Δͱͬͨ →late subʹΑΔͱɺී௨ʹfeature importanceͰ͍͍͠ɺnull importanceྑ͔ͬͨɻpermutation importanceͪΐͬͱඍົ ɾ్த͔Βfast sub͍͗ͯ͢privateͷscore͕0ͷ͔ͬΓʹͳͬͯ͠·ͬͨɺ෮श·Ͱߟ͑Δ͖ͩͬ ͨ ɾਫ਼্͕Βͳͯ͘࠷ޙͷ1ϲ݄μϨͯ͠·ͬͨ
❍ࠓޙ ɾجຊతʹग़ΔίϯϖશͯۚϝμϧΛࢦ ͢ɻ ɾ౷ܭͳͲɺجૅͷษڧͯ͠ɺػցֶशશ ൠʹରͯ͠ɺΑΓਂ͍ཧղΛ͍͖͍ͯͨ͠ɻ ɾνʔϜΜͩΒҰॹʹؤுΓ·͠ΐ͏ʂʂ