Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
了解朴素贝叶斯
Search
yafei002
January 09, 2017
Technology
1
230
了解朴素贝叶斯
yafei002
January 09, 2017
Tweet
Share
More Decks by yafei002
See All by yafei002
了解人工神经网络
yafei002
1
210
了解K-Means算法
yafei002
1
210
了解KNN算法
yafei002
0
170
了解决策树和C4.5算法
yafei002
1
260
数据可视化之视觉感知与认知
yafei002
1
390
数据可视化之地理信息可视化
yafei002
1
390
数据可视化之层次和网络数据可视化(上)
yafei002
1
670
数据可视化之复杂高维多元数据的可视化(上)
yafei002
1
290
Data Visualization Introduction and History
yafei002
1
320
Other Decks in Technology
See All in Technology
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
1
130
22nd ACRi Webinar - 1Finity Tamura-san's slide
nao_sumikawa
0
110
AIエージェントを開発しよう!-AgentCore活用の勘所-
yukiogawa
0
190
Cloud Runでコロプラが挑む 生成AI×ゲーム『神魔狩りのツクヨミ』の裏側
colopl
0
150
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
340
猫でもわかるKiro CLI(セキュリティ編)
kentapapa
0
120
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
har1101
0
330
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
Greatest Disaster Hits in Web Performance
guaca
0
290
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
100
Agile Leadership Summit Keynote 2026
m_seki
1
680
広告の効果検証を題材にした因果推論の精度検証について
zozotech
PRO
0
210
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.1k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.1k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
120
Odyssey Design
rkendrick25
PRO
1
500
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.4k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
410
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Transcript
了解朴素贝叶斯(Naive Bayes) yafei002
概念 • 如果X表示属性集,Y表示类变量,且类变量和属性之间的关系不确定,则可以把X和 Y看作随机变量,P(Y|X)这个条件概率称为Y的后验概率,P(Y)称为Y的先验概率 • 贝叶斯公式 P(X)是常数,P(Y)表示每个类的训练记录所占的比例,容易估计,则最终归结为估计 P(X|Y),其中一种方法是使用朴素贝叶斯分类器 ) (
) ( ) | ( ) | ( X P Y P Y X P X Y P
朴素贝叶斯 • 条件独立性 • 设X,Y和Z表示三个随机变量的集合, 若X和Y之间条件独立 P(X,Y|Z)=P(X|Z)*P(Y|Z) • 条件独立假设:假设属性之间相互 独立
其中每个属性集X={X1,X2,…Xd}包含 d个属性 • 意义 • 多维变量的问题被约减为单变量估计 问题 • 单变量分布估计更简单,也被研究的 更透彻,达到同一精度需要的训练规 模更小
估计分类属性的条件概率 P(婚姻状况=单身|Yes)=2/3 估计连续属性的条件概率:假设连续变量服 从某种概率分布,一般用高斯分布 朴素贝叶斯 朴素贝叶斯分类器对每个类Y计算后验概率
朴素贝叶斯 P(No|X)=0.7*P(X|No)/P(X)=0.0016/P(X) P(Yes|X)=0.3*0/P(X)=0 因为P(No|X)> P(Yes|X) 所以记录分类为No
朴素贝叶斯的特点 • 容易构造,不需要复杂的迭代求解框架,因此非常适用于规模巨大的数据集 • 容易解释 • 更重要的是即使不是最好的分类方法,通常也是非常稳健的 • 面对孤立的噪点 •
面对无关属性 • 相关的属性会降低分类器的性能,因为条件独立假设已不成立
参考资料 PANG-NINGTAN, MICHAELSTEINBACH, & VIPINKUMAR. (2011). 数据挖掘导 论:完整版. 人民邮电出版社. 吴信东,
& VipinKumar. (2013). 数据挖掘十大算法. 清华大学出版社.