Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
了解决策树和C4.5算法
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
yafei002
January 08, 2017
Technology
1
270
了解决策树和C4.5算法
yafei002
January 08, 2017
Tweet
Share
More Decks by yafei002
See All by yafei002
了解人工神经网络
yafei002
1
220
了解朴素贝叶斯
yafei002
1
230
了解K-Means算法
yafei002
1
210
了解KNN算法
yafei002
0
170
数据可视化之视觉感知与认知
yafei002
1
390
数据可视化之地理信息可视化
yafei002
1
400
数据可视化之层次和网络数据可视化(上)
yafei002
1
680
数据可视化之复杂高维多元数据的可视化(上)
yafei002
1
290
Data Visualization Introduction and History
yafei002
1
320
Other Decks in Technology
See All in Technology
SaaSに宿る21g
kanyamaguc
2
180
AWS Systems Managerのハイブリッドアクティベーションを使用したガバメントクラウド環境の統合管理
toru_kubota
1
190
俺の/私の最強アーキテクチャ決定戦開催 ― チームで新しいアーキテクチャに適合していくために / 20260322 Naoki Takahashi
shift_evolve
PRO
1
480
非同期・イベント駆動処理の分散トレーシングの繋げ方
ichikawaken
1
240
VSCode中心だった自分がターミナル沼に入門した話
sanogemaru
0
850
LLMに何を任せ、何を任せないか
cap120
10
6.3k
How to install a gem
indirect
0
2k
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
3
2k
契約書からの情報抽出を行うLLMのスループットを、バッチ処理を用いて最大40%改善した話
sansantech
PRO
3
330
OCI技術資料 : 証明書サービス概要
ocise
1
7.1k
Oracle Cloud Infrastructure(OCI):Onboarding Session(はじめてのOCI/Oracle Supportご利⽤ガイド)
oracle4engineer
PRO
2
17k
Even G2 クイックスタートガイド(日本語版)
vrshinobi1
0
150
Featured
See All Featured
Joys of Absence: A Defence of Solitary Play
codingconduct
1
330
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.1k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
800
From π to Pie charts
rasagy
0
160
The Curious Case for Waylosing
cassininazir
0
280
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
260
Un-Boring Meetings
codingconduct
0
240
Odyssey Design
rkendrick25
PRO
2
560
Transcript
了解决策树与 C4.5算法 yafei002
决策树工作原理
如何选择节点 熵(entropy):信息的期望值
如何选择节点 决策树算法选择最大增益作为最佳划分 增益:
如何选择节点 增益偏向于取值多的属性 增益率(Gain ration)将输出节点的个数纳入考量 C4.5
决策树剪枝 为了避免生成的树过多从而过度拟合训练数据,需要对生成的决策树进行剪枝。 C4.5算法引入了悲观剪枝的方法。 悲观剪枝: 1. 一个节点对应N个实例和E个错误,则该 节点的经验错误率=(E+罚项)/ N 2. 一个子树有L个叶子节点,这些叶子节点共包含∑N个实例和∑E个错误,则该
子树的经验错误率=( ∑ E+L*罚项)/ ∑N 3. 假设子树被它的最佳叶节点替换后,在训练数据集的错误为J,如果 J+罚项<= ∑E+罚项*L + ( ∑ E+罚项)的一倍的标准差 则决定用该最佳节点替换子树
决策树剪枝 X T1 T2 T3 X T1 T2 T3 T2
(X输出最大) (最佳叶节点) 剪枝是单一的自底向上的遍历的过程 图:一个剪枝的中间步骤
PANG-NINGTAN, MICHAELSTEINBACH, & VIPINKUMAR. (2011). 数据挖掘导 论:完整版. 人民邮电出版社. 吴信东, &
VipinKumar. (2013). 数据挖掘十大算法. 清华大学出版社. 参考资料