Gradient Descent Easy

Artiﬁcial Intelligence Gradient Descent soulchild

Gradient Descent Let computer ﬁnd the minimum point in a
given graph or equation

Gradient Descent y 0 10 20 30 40 x -6
-4 -2 0 2 4 6 y = x2

-4 -2 0 2 4 6 y = x2 Minimum point

-4 -2 0 2 4 6 y = x2 Minimum point How does a computer know that this is a minimum point?

Gradient Descent Ans : By brute-forcing the derivative until a
value equal or near to 0 is found y = x2 dy dx = 2x Then guess x by starting from, eg: -6 to 6

-4 -2 0 2 4 6 y = x2

-4 -2 0 2 4 6 y = x2 dy dx = -12

-4 -2 0 2 4 6 y = x2 dy dx = -12 dy dx = —8

-4 -2 0 2 4 6 y = x2 dy dx = -12 dy dx = —8 dy dx = -4

-4 -2 0 2 4 6 y = x2 dy dx = -12 dy dx = —8 dy dx = -4 dy dx = 0

-4 -2 0 2 4 6 y = x2 dy dx = -12 dy dx = —8 dy dx = -4 dy dx = 0 Minimum point found, stop

Gradient Descent A better way to brute force

-4 -2 0 2 4 6 y = x2 In short, it works like this

Gradient Descent How to set a good learning rate (α)
?

Gradient Descent When to stop searching ?

Gradient Descent When to stop searching ? Set a maximum
number of iteration

Gradient Descent When to stop searching ? Set a maximum
number of iteration dy dx < n When n can be 0.1, 0.01,.. etc

Gradient Descent Weakness of Gradient Descent 0 3 6 9
12 -8 -6 -4 -2 0 2 4

12 -8 -6 -4 -2 0 2 4 let say start from here

12 -8 -6 -4 -2 0 2 4 let say start from here dy dx = 0

12 -8 -6 -4 -2 0 2 4 let say start from here dy dx = 0 then computer stop ﬁnding

12 -8 -6 -4 -2 0 2 4 let say start from here dy dx = 0 then computer stop ﬁnding What about this?! smaller than previous point wor

Gradient Descent Weakness of Gradient Descent Gradient Descent may stuck
in a local minima thus can’t ﬁnd the global minima

Gradient Descent Q&A

Gradient Descent Easy

Gradient Descent Easy

soulchild

More Decks by soulchild

Other Decks in Science

Featured

Transcript

Artiﬁcial Intelligence Gradient Descent soulchild

Gradient Descent Let computer ﬁnd the minimum point in a

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent Ans : By brute-forcing the derivative until a

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent A better way to brute force

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent y 0 10 20 30 40 x -6

Gradient Descent How to set a good learning rate (α)

Gradient Descent When to stop searching ?

Gradient Descent When to stop searching ? Set a maximum

Gradient Descent When to stop searching ? Set a maximum

Gradient Descent Weakness of Gradient Descent 0 3 6 9

Gradient Descent Weakness of Gradient Descent 0 3 6 9

Gradient Descent Weakness of Gradient Descent 0 3 6 9

Gradient Descent Weakness of Gradient Descent 0 3 6 9

Gradient Descent Weakness of Gradient Descent 0 3 6 9

Gradient Descent Weakness of Gradient Descent Gradient Descent may stuck

Gradient Descent Q&A