Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
決定木のpredict_proba()の話
Search
Aipa
January 19, 2019
Technology
0
710
決定木のpredict_proba()の話
決定木のpredict_proba()の話
Aipa
January 19, 2019
Tweet
Share
More Decks by Aipa
See All by Aipa
ピンチヒッターです。なにか話します
commander_aipa
0
82
おれたちはいつDXできるのか
commander_aipa
1
46
ウンケーニオキタコワイハナシ
commander_aipa
0
95
Nuxt3 Deeeeeeeeeeeeeeeeeeeeeploy
commander_aipa
0
140
Meilisearchでハイブリッドベクトル検索
commander_aipa
0
91
Honoの導入を検討していたが、Honoの人が来沖するらしいので、急いでHonoを導入した話
commander_aipa
0
170
Dの意思は神を殺す
commander_aipa
0
82
ファインチューニングがしたい
commander_aipa
0
170
サクッと検索サーバを用意する
commander_aipa
0
180
Other Decks in Technology
See All in Technology
Snowflake ML モデルを dbt データパイプラインに組み込む
estie
0
100
DevinでAI AWSエンジニア製造計画 序章 〜CDKを添えて〜/devin-load-to-aws-engineer
tomoki10
0
140
株式会社Awarefy(アウェアファイ)会社説明資料 / Awarefy-Company-Deck
awarefy
3
11k
AIエージェント入門
minorun365
PRO
31
18k
Охота на косуль у древних
ashapiro
0
110
Autonomous Database Serverless 技術詳細 / adb-s_technical_detail_jp
oracle4engineer
PRO
17
45k
エンジニアリング価値を黒字化する バリューベース戦略を用いた 技術戦略策定の道のり
kzkmaeda
6
2.8k
わたしがEMとして入社した「最初の100日」の過ごし方 / EMConfJp2025
daiksy
14
5.1k
スキルだけでは満たせない、 “組織全体に”なじむオンボーディング/Onboarding that fits “throughout the organization” and cannot be satisfied by skills alone
bitkey
0
180
Oracle Database Technology Night #87-1 : Exadata Database Service on Exascale Infrastructure(ExaDB-XS)サービス詳細
oracle4engineer
PRO
1
180
Exadata Database Service on Cloud@Customer セキュリティ、ネットワーク、および管理について
oracle4engineer
PRO
2
1.5k
Iceberg Meetup Japan #1 : Iceberg and Databricks
databricksjapan
0
370
Featured
See All Featured
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
KATA
mclloyd
29
14k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
A Philosophy of Restraint
colly
203
16k
The Cost Of JavaScript in 2023
addyosmani
47
7.4k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
640
For a Future-Friendly Web
brad_frost
176
9.6k
Producing Creativity
orderedlist
PRO
344
40k
Testing 201, or: Great Expectations
jmmastey
42
7.2k
Docker and Python
trallard
44
3.3k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
10
510
Transcript
ܾఆͷ ࣾ-5ΞΠύʔୂ
͢͜ͱ
͢͜ͱ w ܾఆͷॲཧϑϩʔ w ָ࣮͍͠
൪ ͓͢͢ΊͷөըΛΈ͍ͨେ౷ྖ
൪ w "ʣେ౷ྖɺΑ͘ฉ͍͍ͯͩ͘͞ w "ʣʮϫχʯʹજΔ͚ͩͰύλʔϯ͕͋Γ·ͤΜ w "ʣʮαϝʯͦ͜ࢤͰ͢ A͞Μ
൪ w #ʣʮαϝʯઃఆΨϯແࢹͯ͠ϦΞϦςΟ͕ͳ͍ w #ʣαϝʹଟ٭ͷັྗͳ͍ w #ʣωλ͕ΕͨΒ͙͢ϩϘԽʹΔʂʂ w "ʣʮϩϘΫϩίʯΛΕΔΜ͡Όͳ͍ B͞Μ
൪ w "ʣʮϫχʯʹʮ+"84ʯͷΑ͏ͳ໊࡞ͳ͍ͩΖ͏ʂʂ w #ʣʮϚϯΠʔλʔʯྑ࡞Αʂલඈ͍͍͚ͯ͠Ͳ
൪ w "ʣେ౷ྖʂͭΒྫྷࠅͳʮϨϓςΟϦΞϯʯͰ͢ɻܾ͝அΛ w #ʣΕʂʮαϝχετʯʂʂେ౷ྖɻ͓ئ͍͠·͢ɻ
൪ w େ౷ྖʣʮελʔΥʔζʯΈΔΘ
൪ʢݩωλͱ͍͏ؙ͔ύΫϦʣ w ӕࣈນγϦʔζ w େ౷ྖʹ͓͢͢Ί͢ΔөըͲͪΒ͔Λ૪͏ಈը w ݱࡏআ͞Ε͍ͯΔʢ೦ ɾТɾʆ ʣ
൪ w ·͊ͰؾʹͳΓ·͢ΑͶʢαϝ͕໘ന͍ͷ͔ϫχ͕໘ന͍ͷ͔ʣ
൪ w ܦݧΛݩʹܰྔͳσʔληοτΛ༻ҙ͢Δ ߦ͙Β͍
൪ w ܾఆΛ࡞͢Δ
൪
൪ w Ͳͷ͘Βֶ͍श͕͏·͍ͬͯ͘ΔΜ͚ͩͬʁ
൪ w ;Ή;Ήʙʙʙʢനʣ
ٙ ͜Ε
ࢲɺؾʹͳΓ·͢ w ͲΜͳͯ͠ܭࢉ͞Ε͍ͯΔͷʁ w ༧ w ʮྨ͞ΕͨΫϥεZJྨ͞Εͨσʔλ૯֬ʯ
ٙ w ௐͯΈͨ
ܾఆͷॲཧϑϩʔ
ܾఆͷॲཧϑϩʔ ᶃroot nodeΛ༻ҙ͢Δ
ܾఆͷॲཧϑϩʔ ᶄೖྗ͞Εͨσʔλͷ ΫϥεϥϕϧΛଟܾͰܾΊΔ ͭ·Βͳ͍
ᶅׂ͢Δલʹ giniΛٻΊΔ => [9, 9] => 0.5 ͭ·Βͳ͍ ܾఆͷॲཧϑϩʔ
ᶆׂީิʢಛྔʣΛ࡞͠ɺ ݅Λ࡞͢Δ ͭ·Βͳ͍ or ʮ1ͳΒαϝ 0ͳΒϫχʯͳͱ͖ ݅ਅΜத => 0.5ͱͳΔ ܾఆͷॲཧϑϩʔ
ᶇ࡞ͨ݅͠Ͱׂͯ͠ΈΔ ͭ·Βͳ͍ or ϫχ13 αϝ5 ܾఆͷॲཧϑϩʔ
ᶈׂޙͷσʔλͦΕͧΕͰ giniΛܭࢉ ͭ·Βͳ͍ or ϫχ13 => 0.497 αϝ5 => 0.48
ܾఆͷॲཧϑϩʔ
ᶉׂ݅ͷળ͠ѱ͠Λ அ͢ΔͨΊʹɺ ׂલޙͷෆ७ͷมԽΛ ٻΊ·͢ ͭ·Βͳ͍ or ϫχ13 => 0.497 ׂ͞Εׂͨ߹
=> 13/18 => 0.72 αϝ5 => 0.48 ׂ͞Εׂͨ߹ => 5/18 => 0.27 ܾఆͷॲཧϑϩʔ
ᶉׂ݅ͷળ͠ѱ͠Λ அ͢ΔͨΊʹɺ ׂલޙͷෆ७ͷมԽΛ ٻΊ·͢ ͭ·Βͳ͍ or ׂલͷgini - ((ϫχׂޙͷgini *
ϫχׂ͞Εׂͨ߹) + (αϝׂޙͷgini * αϝׂ͞Εׂͨ߹)) => 0.5 - ((0.497 * 0.72) + (0.48 * 0.27)) => 0.00769 ܾఆͷॲཧϑϩʔ
ᶊධՁޙͷ(จࣈ)Λอ͓࣋ͯ͘͠ => ᶆʙᶉΛ܁Γฦ͠ൺֱͯ͠ Ұ൪େ͖͍Λ => ׂʹϕετͳಛྔ͕ܾ·Δ ͭ·Βͳ͍ or ׂલͷgini -
((ϫχׂޙͷgini * ϫχׂ͞Εׂͨ߹) + (αϝׂޙͷgini * αϝׂ͞Εׂͨ߹)) => 0.5 - ((0.497 * 0.72) + (0.48 * 0.27)) => 0.00769 ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ᶋϫχͱαϝΛྨͨ͠σʔλΛ༻͍ͯ ࠨଆͱӈଆʹࢬΛ࡞Δ => ᶃʙᶊͱಉ͜͡ͱΛ͢Δ ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ᶌධՁޙͷ͕มԽ͠ͳ͚Εऴྃ => ࠓճಛྔ͔̍ͭ͠ͳ͍ͷͰ ਂ͞2ͰऴΘΔ ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ݁Ռ ※max_depthͱ͔ min_sample_leafͱ͔Ͱ ͬͱࡉ͔͍ܾ݅ΊΕΔ͚ͲׂѪ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6
αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍ 3 ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ܾఆͷॲཧϑϩʔ
QSFEJDU@QSPCBͷ࣮
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ιʔεΛಡΜͰΈΔͱ ܇࿅࣌ʹྨ͞Ε͍ͯΔ σʔλΛͬͯࢉग़ͯ͠ ͍Δ͜ͱ͕Θ͔ͬͨ
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ᶃςετσʔλΛೖྗ͢Δ ςετσʔλ
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ᶄྨ͢Δ ςετσʔλ ϫχͬΆ͍
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 ᶅྨ͞ΕͨNodeʹ͋Δ ܇࿅࣌ͷྨσʔλΛͬͯ ֬ΛٻΊΔ ςετσʔλ
-> [[ͭ·Βͳ͍,͓͠Ζ͍]] -> [[7, 6]] σʔλຖʹ߹ܭ͢Δ [[7 ,6]].sum(axis=1) -> [13] ׂΔ [[7, 6]] / [13] -> [[0.538, 0.461]]
QSFEJDU@QSPCBͷ࣮ w TDJLJUMFBSOͷ࣮ ೖྗͨ͠σʔλ͕ͲͷNodeʹ͋ͯ·Δ͔୳ࡧͯ͠ɺ֘ ͨ͠Node͕ྨͨ͠܇࿅࣌ͷσʔλΛฦ͢(Cython) ֘ͨ͠Ϋϥε͝ͱͷσʔλΛσʔλ૯ͰׂΔ ex) [[ͭ·Βͳ͍,͓͠Ζ͍]] -> [[7,
6]] σʔλຖʹ߹ܭ͢Δ [[7 ,6]].sum(axis=1) -> [13] ׂΔ [[7, 6]] / [13] -> [[0.538, 0.461]]
ࡶײ
ࡶײ w ܾఆͷͳͷͰɺଞͷΞϧΰϦζϜͷ࣮Έ͍ͨ w αϝόϯβΠ w ϫχόϯβΠ
͓·͚
͓·͚ ʮαϝਓΛऻ͏ʯϨοςϧΛషͬͨ ໊࡞தͷ໊࡞ લඈ͍͍͚ͯ͠Ͳ ྑ࡞
͓·͚ ʮαϝਓΛऻ͏ʯϨοςϧΛషͬͨ ໊࡞தͷ໊࡞ લඈ͍͍͚ͯ͠Ͳ ྑ࡞