Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
決定木のpredict_proba()の話
Search
Aipa
January 19, 2019
Technology
0
720
決定木のpredict_proba()の話
決定木のpredict_proba()の話
Aipa
January 19, 2019
Tweet
Share
More Decks by Aipa
See All by Aipa
ピンチヒッターです。なにか話します
commander_aipa
0
120
おれたちはいつDXできるのか
commander_aipa
1
74
ウンケーニオキタコワイハナシ
commander_aipa
0
120
Nuxt3 Deeeeeeeeeeeeeeeeeeeeeploy
commander_aipa
0
180
Meilisearchでハイブリッドベクトル検索
commander_aipa
0
140
Honoの導入を検討していたが、Honoの人が来沖するらしいので、急いでHonoを導入した話
commander_aipa
0
200
Dの意思は神を殺す
commander_aipa
0
100
ファインチューニングがしたい
commander_aipa
0
200
サクッと検索サーバを用意する
commander_aipa
0
210
Other Decks in Technology
See All in Technology
ヘブンバーンズレッドのレンダリングパイプライン刷新
gree_tech
PRO
0
590
自作JSエンジンに推しプロポーザルを実装したい!
sajikix
1
160
dbt開発 with Claude Codeのためのガードレール設計
10xinc
1
380
「魔法少女まどか☆マギカ Magia Exedra」での負荷試験の実践と学び
gree_tech
PRO
0
620
Bye-Bye Query Spaghetti: Write Queries You'll Actually Understand Using Pipelined SQL Syntax
tobiaslampertlotum
0
150
落ちる 落ちるよ サーバーは落ちる
suehiromasatoshi
0
140
Snowflakeの生成AI機能を活用したデータ分析アプリの作成 〜Cortex AnalystとCortex Searchの活用とStreamlitアプリでの利用〜
nayuts
0
350
カミナシ社の『ID管理基盤』製品内製 - その意思決定背景と2年間の進化 #AWSUnicornDay / Kaminashi ID - The Big Whys
kaminashi
3
810
シークレット管理だけじゃない!HashiCorp Vault でデータ暗号化をしよう / Beyond Secret Management! Let's Encrypt Data with HashiCorp Vault
nnstt1
3
220
AWSで推進するデータマネジメント
kawanago
0
1.1k
品質視点から考える組織デザイン/Organizational Design from Quality
mii3king
0
110
AWS環境のリソース調査を Claude Code で効率化 / aws investigate with cc devio2025
masahirokawahara
2
1.4k
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3k
How STYLIGHT went responsive
nonsquared
100
5.8k
The Art of Programming - Codeland 2020
erikaheidi
55
13k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
It's Worth the Effort
3n
187
28k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.6k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
910
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Navigating Team Friction
lara
189
15k
Building Applications with DynamoDB
mza
96
6.6k
Transcript
ܾఆͷ ࣾ-5ΞΠύʔୂ
͢͜ͱ
͢͜ͱ w ܾఆͷॲཧϑϩʔ w ָ࣮͍͠
൪ ͓͢͢ΊͷөըΛΈ͍ͨେ౷ྖ
൪ w "ʣେ౷ྖɺΑ͘ฉ͍͍ͯͩ͘͞ w "ʣʮϫχʯʹજΔ͚ͩͰύλʔϯ͕͋Γ·ͤΜ w "ʣʮαϝʯͦ͜ࢤͰ͢ A͞Μ
൪ w #ʣʮαϝʯઃఆΨϯແࢹͯ͠ϦΞϦςΟ͕ͳ͍ w #ʣαϝʹଟ٭ͷັྗͳ͍ w #ʣωλ͕ΕͨΒ͙͢ϩϘԽʹΔʂʂ w "ʣʮϩϘΫϩίʯΛΕΔΜ͡Όͳ͍ B͞Μ
൪ w "ʣʮϫχʯʹʮ+"84ʯͷΑ͏ͳ໊࡞ͳ͍ͩΖ͏ʂʂ w #ʣʮϚϯΠʔλʔʯྑ࡞Αʂલඈ͍͍͚ͯ͠Ͳ
൪ w "ʣେ౷ྖʂͭΒྫྷࠅͳʮϨϓςΟϦΞϯʯͰ͢ɻܾ͝அΛ w #ʣΕʂʮαϝχετʯʂʂେ౷ྖɻ͓ئ͍͠·͢ɻ
൪ w େ౷ྖʣʮελʔΥʔζʯΈΔΘ
൪ʢݩωλͱ͍͏ؙ͔ύΫϦʣ w ӕࣈນγϦʔζ w େ౷ྖʹ͓͢͢Ί͢ΔөըͲͪΒ͔Λ૪͏ಈը w ݱࡏআ͞Ε͍ͯΔʢ೦ ɾТɾʆ ʣ
൪ w ·͊ͰؾʹͳΓ·͢ΑͶʢαϝ͕໘ന͍ͷ͔ϫχ͕໘ന͍ͷ͔ʣ
൪ w ܦݧΛݩʹܰྔͳσʔληοτΛ༻ҙ͢Δ ߦ͙Β͍
൪ w ܾఆΛ࡞͢Δ
൪
൪ w Ͳͷ͘Βֶ͍श͕͏·͍ͬͯ͘ΔΜ͚ͩͬʁ
൪ w ;Ή;Ήʙʙʙʢനʣ
ٙ ͜Ε
ࢲɺؾʹͳΓ·͢ w ͲΜͳͯ͠ܭࢉ͞Ε͍ͯΔͷʁ w ༧ w ʮྨ͞ΕͨΫϥεZJྨ͞Εͨσʔλ૯֬ʯ
ٙ w ௐͯΈͨ
ܾఆͷॲཧϑϩʔ
ܾఆͷॲཧϑϩʔ ᶃroot nodeΛ༻ҙ͢Δ
ܾఆͷॲཧϑϩʔ ᶄೖྗ͞Εͨσʔλͷ ΫϥεϥϕϧΛଟܾͰܾΊΔ ͭ·Βͳ͍
ᶅׂ͢Δલʹ giniΛٻΊΔ => [9, 9] => 0.5 ͭ·Βͳ͍ ܾఆͷॲཧϑϩʔ
ᶆׂީิʢಛྔʣΛ࡞͠ɺ ݅Λ࡞͢Δ ͭ·Βͳ͍ or ʮ1ͳΒαϝ 0ͳΒϫχʯͳͱ͖ ݅ਅΜத => 0.5ͱͳΔ ܾఆͷॲཧϑϩʔ
ᶇ࡞ͨ݅͠Ͱׂͯ͠ΈΔ ͭ·Βͳ͍ or ϫχ13 αϝ5 ܾఆͷॲཧϑϩʔ
ᶈׂޙͷσʔλͦΕͧΕͰ giniΛܭࢉ ͭ·Βͳ͍ or ϫχ13 => 0.497 αϝ5 => 0.48
ܾఆͷॲཧϑϩʔ
ᶉׂ݅ͷળ͠ѱ͠Λ அ͢ΔͨΊʹɺ ׂલޙͷෆ७ͷมԽΛ ٻΊ·͢ ͭ·Βͳ͍ or ϫχ13 => 0.497 ׂ͞Εׂͨ߹
=> 13/18 => 0.72 αϝ5 => 0.48 ׂ͞Εׂͨ߹ => 5/18 => 0.27 ܾఆͷॲཧϑϩʔ
ᶉׂ݅ͷળ͠ѱ͠Λ அ͢ΔͨΊʹɺ ׂલޙͷෆ७ͷมԽΛ ٻΊ·͢ ͭ·Βͳ͍ or ׂલͷgini - ((ϫχׂޙͷgini *
ϫχׂ͞Εׂͨ߹) + (αϝׂޙͷgini * αϝׂ͞Εׂͨ߹)) => 0.5 - ((0.497 * 0.72) + (0.48 * 0.27)) => 0.00769 ܾఆͷॲཧϑϩʔ
ᶊධՁޙͷ(จࣈ)Λอ͓࣋ͯ͘͠ => ᶆʙᶉΛ܁Γฦ͠ൺֱͯ͠ Ұ൪େ͖͍Λ => ׂʹϕετͳಛྔ͕ܾ·Δ ͭ·Βͳ͍ or ׂલͷgini -
((ϫχׂޙͷgini * ϫχׂ͞Εׂͨ߹) + (αϝׂޙͷgini * αϝׂ͞Εׂͨ߹)) => 0.5 - ((0.497 * 0.72) + (0.48 * 0.27)) => 0.00769 ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ᶋϫχͱαϝΛྨͨ͠σʔλΛ༻͍ͯ ࠨଆͱӈଆʹࢬΛ࡞Δ => ᶃʙᶊͱಉ͜͡ͱΛ͢Δ ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ᶌධՁޙͷ͕มԽ͠ͳ͚Εऴྃ => ࠓճಛྔ͔̍ͭ͠ͳ͍ͷͰ ਂ͞2ͰऴΘΔ ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ݁Ռ ※max_depthͱ͔ min_sample_leafͱ͔Ͱ ͬͱࡉ͔͍ܾ݅ΊΕΔ͚ͲׂѪ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6
αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍ 3 ܾఆͷॲཧϑϩʔ
ͭ·Βͳ͍ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ܾఆͷॲཧϑϩʔ
QSFEJDU@QSPCBͷ࣮
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ιʔεΛಡΜͰΈΔͱ ܇࿅࣌ʹྨ͞Ε͍ͯΔ σʔλΛͬͯࢉग़ͯ͠ ͍Δ͜ͱ͕Θ͔ͬͨ
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ᶃςετσʔλΛೖྗ͢Δ ςετσʔλ
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 αϝ ͭ·Βͳ͍ 2 ͓͠Ζ͍
3 ᶄྨ͢Δ ςετσʔλ ϫχͬΆ͍
QSFEJDU@QSPCBͷ࣮ ϫχ ͭ·Βͳ͍ 7 ͓͠Ζ͍ 6 ᶅྨ͞ΕͨNodeʹ͋Δ ܇࿅࣌ͷྨσʔλΛͬͯ ֬ΛٻΊΔ ςετσʔλ
-> [[ͭ·Βͳ͍,͓͠Ζ͍]] -> [[7, 6]] σʔλຖʹ߹ܭ͢Δ [[7 ,6]].sum(axis=1) -> [13] ׂΔ [[7, 6]] / [13] -> [[0.538, 0.461]]
QSFEJDU@QSPCBͷ࣮ w TDJLJUMFBSOͷ࣮ ೖྗͨ͠σʔλ͕ͲͷNodeʹ͋ͯ·Δ͔୳ࡧͯ͠ɺ֘ ͨ͠Node͕ྨͨ͠܇࿅࣌ͷσʔλΛฦ͢(Cython) ֘ͨ͠Ϋϥε͝ͱͷσʔλΛσʔλ૯ͰׂΔ ex) [[ͭ·Βͳ͍,͓͠Ζ͍]] -> [[7,
6]] σʔλຖʹ߹ܭ͢Δ [[7 ,6]].sum(axis=1) -> [13] ׂΔ [[7, 6]] / [13] -> [[0.538, 0.461]]
ࡶײ
ࡶײ w ܾఆͷͳͷͰɺଞͷΞϧΰϦζϜͷ࣮Έ͍ͨ w αϝόϯβΠ w ϫχόϯβΠ
͓·͚
͓·͚ ʮαϝਓΛऻ͏ʯϨοςϧΛషͬͨ ໊࡞தͷ໊࡞ લඈ͍͍͚ͯ͠Ͳ ྑ࡞
͓·͚ ʮαϝਓΛऻ͏ʯϨοςϧΛషͬͨ ໊࡞தͷ໊࡞ લඈ͍͍͚ͯ͠Ͳ ྑ࡞