Slide 11
Slide 11 text
7
9
痥 5 畍 剑㽍岀ה铎䊴ꟼ侧* 5.5 剑㽍岀ה㔐䌓ٌرٕ
ْٚ٭ذע a כ b כ σ ךֵ׆כמ峜䟨יׂדַնאסג״յ劄㹏岺
氠ַ劄箽潨溷ע a כ b כ σ 寛״׆כדכַֹסע锶㝤םַֹ
מיׂדַնױגյ♀㎇סنؚ٭تע㎇䊟ٓظٜסג״յσ ע㴻俙כ
ײםյa כ b ס⡑׆סゼ꾴陭㴻־㸬⮂׆כ脝ֻױն
L(a, b) = Π
1
√
2πσ2
exp −
(yi
− (axi
+ b))2
2σ2
♀㎇ס劄㹏岺מֽׄقْٚ٭ذ θ ע a כ b סג״յ㹏䍲ע L(a, b) כ皑
䑑יַױնױגյi 沁潨סئ٤وٜ (xi, yi
) כ陭㴻יַ׆כמ峜
䟨יׂדַն׆ס갾מ㸐俙㹏䍲מֵג logL(a, b) 阛砯כ┫阾ס
ֹמםױն
logL(a, b) = −
(yi
− (axi
+ b))2
2σ2
+ Const
׆׆ך σ ע㴻俙כַֽגסךյ㹏䍲ס劄㝕ⵊ鉿ֹמֵגזיע
−(yi
− (axi
+ b))2
= − (yi
− (axi
+ b))2
ס劄㝕⡑ゼ꾴闋ׄף虘ַ׆כֿ־ױն׆ס䑑ׂ锶כ◝▗⾔
ס劄㸯ⵊ鉿ֹ׆כך㹏䍲ס劄㝕ⵊֿך׀׆כֿ־ױն׆׆ױךס
需מזיյ潨溷㜟俙ס ˆ
y מ σ ֿ㴻俙ס婞锺⮔䉘♳㴻כյ劄㹏岺־
劄㸯◝▗岺ֿ㸬⮂ך׀כַֹ׆כֿ־ױն
5.5.4 DeepLearning ה剑㽍岀*
DeepLearning ס靯䈼ꫀ俙כיׂ氠ַ★䈼ؙ٤عٞم٭ (Cross
Entropy) 靯䈼يٜؽ٭ؕ⮔䉘♳㴻ג┪ך劄㹏岺氠ַכ㸬⮂
׆כֿך׀ױն
L(p) = Πpti
i
(1 − pi
)1−ti
┪阾ֿيٜؽ٭ؕ⮔䉘⩧מג㹏䍲מםױն׆הס㸐俙⺅זג
㸐俙㹏䍲ע┫阾סֹמםױն
logL(p) = tilogpi
+ (1 − ti
)log(1 − pi
)
׆׆ך pi
ֿ softmax ꫀ俙סؓؗعوشعכ脝ֻםյ׆ע◝⡑מֽ
ׄ★䈼ؙ٤عٞم٭靯䈼כ⻎瞏ם䑑מםזיַױն
79