Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
了解朴素贝叶斯
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
yafei002
January 09, 2017
Technology
1
230
了解朴素贝叶斯
yafei002
January 09, 2017
Tweet
Share
More Decks by yafei002
See All by yafei002
了解人工神经网络
yafei002
1
220
了解K-Means算法
yafei002
1
210
了解KNN算法
yafei002
0
170
了解决策树和C4.5算法
yafei002
1
270
数据可视化之视觉感知与认知
yafei002
1
390
数据可视化之地理信息可视化
yafei002
1
400
数据可视化之层次和网络数据可视化(上)
yafei002
1
680
数据可视化之复杂高维多元数据的可视化(上)
yafei002
1
290
Data Visualization Introduction and History
yafei002
1
320
Other Decks in Technology
See All in Technology
Network Firewall Proxyで 自前プロキシを消し去ることができるのか
gusandayo
0
130
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
3
2k
OCI技術資料 : 証明書サービス概要
ocise
1
7.1k
契約書からの情報抽出を行うLLMのスループットを、バッチ処理を用いて最大40%改善した話
sansantech
PRO
3
330
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
イベントで大活躍する電子ペーパー名札を作る(その2) 〜 M5PaperとM5PaperS3 〜 / IoTLT @ JLCPCB オープンハードカンファレンス
you
PRO
0
220
昔話で振り返るAWSの歩み ~S3誕生から20年、クラウドはどう進化したのか~
nrinetcom
PRO
0
120
Bref でサービスを運用している話
sgash708
0
210
AI時代のオンプレ-クラウドキャリアチェンジ考
yuu0w0yuu
0
650
AI時代のシステム開発者の仕事_20260328
sengtor
0
310
AgentCoreとLINEを使った飲食店おすすめアプリを作ってみた
yakumo
2
270
SaaSに宿る21g
kanyamaguc
2
180
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
55
8k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
160
Designing Experiences People Love
moore
143
24k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
170
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.1k
Designing for humans not robots
tammielis
254
26k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Building Adaptive Systems
keathley
44
3k
Being A Developer After 40
akosma
91
590k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
54k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Transcript
了解朴素贝叶斯(Naive Bayes) yafei002
概念 • 如果X表示属性集,Y表示类变量,且类变量和属性之间的关系不确定,则可以把X和 Y看作随机变量,P(Y|X)这个条件概率称为Y的后验概率,P(Y)称为Y的先验概率 • 贝叶斯公式 P(X)是常数,P(Y)表示每个类的训练记录所占的比例,容易估计,则最终归结为估计 P(X|Y),其中一种方法是使用朴素贝叶斯分类器 ) (
) ( ) | ( ) | ( X P Y P Y X P X Y P
朴素贝叶斯 • 条件独立性 • 设X,Y和Z表示三个随机变量的集合, 若X和Y之间条件独立 P(X,Y|Z)=P(X|Z)*P(Y|Z) • 条件独立假设:假设属性之间相互 独立
其中每个属性集X={X1,X2,…Xd}包含 d个属性 • 意义 • 多维变量的问题被约减为单变量估计 问题 • 单变量分布估计更简单,也被研究的 更透彻,达到同一精度需要的训练规 模更小
估计分类属性的条件概率 P(婚姻状况=单身|Yes)=2/3 估计连续属性的条件概率:假设连续变量服 从某种概率分布,一般用高斯分布 朴素贝叶斯 朴素贝叶斯分类器对每个类Y计算后验概率
朴素贝叶斯 P(No|X)=0.7*P(X|No)/P(X)=0.0016/P(X) P(Yes|X)=0.3*0/P(X)=0 因为P(No|X)> P(Yes|X) 所以记录分类为No
朴素贝叶斯的特点 • 容易构造,不需要复杂的迭代求解框架,因此非常适用于规模巨大的数据集 • 容易解释 • 更重要的是即使不是最好的分类方法,通常也是非常稳健的 • 面对孤立的噪点 •
面对无关属性 • 相关的属性会降低分类器的性能,因为条件独立假设已不成立
参考资料 PANG-NINGTAN, MICHAELSTEINBACH, & VIPINKUMAR. (2011). 数据挖掘导 论:完整版. 人民邮电出版社. 吴信东,
& VipinKumar. (2013). 数据挖掘十大算法. 清华大学出版社.