Upgrade to PRO for Only $50/Yearโ€”Limited-Time Offer! ๐Ÿ”ฅ

LDA Topic Modeling

Avatar for Buzzvil Buzzvil
November 28, 2018

LDA Topicย Modeling

Avatar for Buzzvil

Buzzvil

November 28, 2018
Tweet

More Decks by Buzzvil

Other Decks in Technology

Transcript

  1. ํ† ํ”ฝ ๋ชจ๋ธ๋ง์ด๋ž€? โ€ข ์ฃผ์–ด์ง„ ์—ฌ๋Ÿฌ ๋ฌธ์„œ์—์„œ ํ† ํ”ฝ(์ฃผ์ œ)์„ ์ถ”์ถœํ•˜์—ฌ ๊ฐ ๋ฌธ์„œ์—

    ์–ด๋–ค ์ฃผ์ œ๊ฐ€ ์žˆ๋Š”์ง€, ์ธ์‚ฌ์ดํŠธ๋ฅผ ์–ป๊ฑฐ๋‚˜ ๊ฐ ๋ฌธ์„œ๋ฅผ ์ฃผ์ œ๋ณ„๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜. โ€ข ์—ฌ๊ธฐ์„œ ํ† ํ”ฝ์€ ๋‹จ์–ด์˜ ์ง‘ํ•ฉ์„ ๊ฐ€๋ฆฌํ‚จ๋‹ค. โ€ข ํ•œ ๋‹จ์–ด๊ฐ€ ๋‹ค๋ฅธ ๋‹จ์–ด์™€ ๊ฐ™์ด ์ถœํ˜„ํ•˜๋Š” ๋ฌธ์„œ์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋งŽ์„ ์ˆ˜๋ก ๊ทธ ๋‘ ๋‹จ์–ด๋Š” ๊ฐ™์€ ํ† ํ”ฝ ๋‚ด์— ๊ทธ๋ฃนํ•‘ ๋  ๊ฐ€๋Šฅ์„ฑ์ด ์˜ฌ๋ผ๊ฐ„๋‹ค.
  2. ์‹ฌํ”Œํ•œ ์˜ˆ์‹œ. โ€ข ๋ฌธ์„œ 1์€ ํ† ํ”ฝ 1์—์„œ๋งŒ ๋‚˜์˜ค๋Š” ๋‹จ์–ด๋งŒ์œผ๋กœ ์ด๋ฃจ์–ด์ ธ

    ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฏ€๋กœ ๋ฌธ์„œ 1์€ 100% ํ† ํ”ฝ 1๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ๋‹ค. โ€ข ๋ฌธ์„œ 2๋Š” ํ† ํ”ฝ 1์—์„œ๋งŒ ๋‚˜์˜ค๋Š” ๋‹ค์–ด์ธ ๊ฐœ๊ฐ€ 60%์ด๊ณ , ํ† ํ”ฝ 2์—์„œ๋งŒ ์žˆ๋Š” ๋‹จ์–ด์ธ ๊ณ ์–‘์ด๊ฐ€ ๋‚˜๋จธ์ง€ 40%์ด๋‹ค. ๊ทธ๋Ÿฌ๋ฏ€๋กœ ๋ฌธ์„œ 2๋Š” 60% ํ† ํ”ฝ 1, 40% ํ† ํ”ฝ 2๋กœ ์ด๋ฃจ์–ด์กŒ๋‹ค๊ณ  ์•Œ ์ˆ˜ ์žˆ๋‹ค. โ€ข ๋ฌธ์„œ 3์€ ์‚ฐ์ฑ…์ด๋ผ๋Š” ํ† ํ”ฝ2์— ๋‚˜์˜ค๋Š” ๋‹จ์–ด๋งŒ์œผ๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ์œผ๋‹ˆ 100 % ํ† ํ”ฝ 2๋กœ๋งŒ ์ด๋ฃจ์–ด์ ธ์žˆ๋‹ค. ํ† ํ”ฝ 1 ํ† ํ”ฝ 2 ๊ฐœ ๊ณ ์–‘์ด ์‚ฐ์ฑ… ๊ฐœ๋‹ค๋ž˜ ๋ฌธ์„œ 1 ํ† ํ”ฝ1: 100% ํ† ํ”ฝ 2: 0 % ๋ฌธ์„œ 2 ํ† ํ”ฝ1: 60% ํ† ํ”ฝ 2: 40 % ๋ฌธ์„œ 3 ํ† ํ”ฝ1: 0% ํ† ํ”ฝ 2: 100 % ๊ฐœ ๊ฐœ ์‚ฐ์ฑ… ๊ณ ์–‘์ด ๊ฐœ๋‹ค๋ž˜ ๊ฐœ ๊ฐœ ์‚ฐ์ฑ… ๊ณ ์–‘์ด
  3. ํ† ํ”ฝ ๋ชจ๋ธ๋ง์˜ ํ™œ์šฉ ์˜ˆ โ€ข ๋ฌธ์„œ์˜ ๋ถ„๋ฅ˜ โ—ฆ ํ† ํ”ฝ ๋ชจ๋ธ๋ง์˜

    ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ์šฉ๋„ โ€ข ๊ฒ€์ƒ‰ โ—ฆ ๋‹จ์ˆœํžˆ ์ž…๋ ฅ ํ‚ค์›Œ๋“œ์˜ ๊ฐœ์ˆ˜๋งŒ์„ ๊ฐ€์ง€๊ณ  ๊ฒ€์ƒ‰๊ฒฐ๊ณผ๋ฅผ ์ •ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์€(์˜ˆ tfidf) ์ž…๋ ฅ ํ‚ค์›Œ๋“œ๊ฐ€ ํฌํ•จ๋˜์ง€ ์•Š์€ ๋ฌธ์„œ๋Š” ๊ฒ€์ƒ‰๊ฒฐ๊ณผ์—์„œ ์ œ์™ธํ•˜๊ฒŒ ๋œ๋‹ค. โ—ฆ ํ† ํ”ฝ ๋ชจ๋ธ๋ง์€ ์ž…๋ ฅ๋œ ํ‚ค์›Œ๋“œ์— ์—†๋Š” ๋‹จ์–ด๋งŒ์„ ๊ฐ€์ง„ ๋ฌธ์„œ๋ผ๋„ ์ž…๋ ฅ๋œ ํ‚ค์›Œ๋“œ์™€ ์—ฐ๊ด€์ด ๋†’๋‹ค๋ฉด ๊ฒ€์ƒ‰๊ฒฐ๊ณผ์˜ ์ƒ์œ„์— ํฌํ•จ ์‹œํ‚ฌ ์ˆ˜๋„ ์žˆ๋‹ค. โ€ข ์ฃผ์–ด์ง„ ๋ฌธ์„œ๋“ค์— ๋Œ€ํ•œ ์ธ์‚ฌ์ดํŠธ โ—ฆ ์ฃผ์–ด์ง„ ๋ฌธ์„œ์˜ ์ง‘ํ•ฉ์—์„œ ์–ด๋–ปํ•œ ์ฃผ์ œ๋“ค์ด ๋‚˜ํƒ€๋‚˜๋Š”์ง€ ๊ด€์ฐฐํ•˜์—ฌ ์ƒˆ๋กœ์šด ์ธ์‚ฌ์ดํŠธ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค. โ—ฆ ๋น„์ค‘์ด ๋†’์€ ์ฃผ์ œ์— ๋งž์ถ˜ ์ปจํ…์ธ ์˜ ์ž‘์„ฑ ๋“ฑ. โ€ข ์ถ”์ฒœ ์‹œ์Šคํ…œ โ—ฆ ํ…์ŠคํŠธ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ์•„์ดํ…œ๋“ค์˜ ๊ฒฝ์šฐ ํ† ํ”ฝ ๋ชจ๋ธ๋ง์œผ๋กœ ํ† ํ”ฝ์„ ์ถ”์ถœํ•˜๊ณ  ๊ฐ ์•„์ดํ…œ์˜ ํ† ํ”ฝ ๊ตฌ์„ฑ ๋ฒกํ„ฐ๋ฅผ ์ƒ์„ฑํ›„, ์œ ์ €๊ฐ€ ์—ด๋žŒํ•œ ์•„์ดํ…œ๋“ค์˜ ํ† ํ”ฝ ๊ตฌ์„ฑ๋ฅ ์„ ๊ตฌํ•œํ›„ ์ด์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ์œ ์ €๊ฐ€ ์—ด๋žŒํ•˜๋Š” ์•„์ดํ…œ๋“ค๊ณผ ๋น„์Šทํ•œ ๊ตฌ์„ฑ์˜ ํ† ํ”ฝ์„ ๊ฐ€์ง„ ์•„์ดํ…œ์„ ์ถ”์ฒœํ•  ์ˆ˜ ์žˆ๋‹ค.
  4. LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง์ด ์ƒ๊ฐํ•˜๋Š” ๋ฌธ์„œ ์ƒ์„ฑ ์˜ˆ์‹œ (์ด๋ฏธ ํ† ํ”ฝ๊ณผ ๋ฌธ์„œ์˜

    ํ† ํ”ฝ์ด ์ •ํ•ด์กŒ์„ ๊ฒฝ์šฐ) ๊ฐ ํ† ํ”ฝ์€ ๋‹จ์–ด์˜ ๋ถ„ํฌ๋„์ด๋‹ค. ๋‹ค์Œ๊ณผ ๊ฐ™์€ 2๊ฐœ์˜ ํ† ํ”ฝ์ด ์ฃผ์–ด์กŒ๋‹ค. ๋‹จ์–ด ๊ณ ์–‘์ด ๊ฐœ ํ† ํ”ฝ 1 80% 20% ํ† ํ”ฝ 2 10% 90% ์—ฌ๊ธฐ์„œ ํ† ํ”ฝ 1์„ 40% ํ† ํ”ฝ 2๋ฅผ 60%๋กœ ํ•ด์„œ ๋‹จ์–ด๊ฐ€ 10๊ฐœ ๋“ค์–ด๊ฐ„ ๋ฌธ์„œ๋ฅผ ๋งŒ๋“ค๊ณ ์ž ํ•œ๋‹ค. ํ† ํ”ฝ 1 ํ† ํ”ฝ 2 40% 60%
  5. 10 ๋‹จ์–ด๋“ค์˜ ํ† ํ”ฝ์„ ์ •ํ•œ๋‹ค. 40%์˜ ํ™•๋ฅ ๋กœ ํ† ํ”ฝ1์„ ์„ ํƒํ•˜๊ณ  60%์˜ ํ™•๋ฅ ๋กœ

    ํ† ํ”ฝ 2๋ฅผ ๋žœ๋คํ•˜๊ฒŒ ์„ ํƒํ•œ๋‹ค. 1 2 1 2 2 1 1 2 2 2 ๋Œ€๊ฐœ๋Š” ์•„๋ž˜์™€ ๊ฐ™์ด ํ™•๋ฅ ๋ถ„ํฌ์™€ ๊ฐ™์ด ๋Œ€๋žต 1์ธ ๋‹จ์–ด๊ฐ€ 4๊ฐœ, 2์ธ ๋‹จ์–ด๊ฐ€ 6๊ฐœ์—์„œ ๋‹ค์†Œ ์•ฝ๊ฐ„ ์ฐจ์ด๊ฐ€ ๋‚˜๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค๊ฒ ์ง€๋งŒ, 2 2 2 2 2 2 2 2 2 2 ๋žœ๋คํ•˜๊ฒŒ ์ •ํ•˜๋Š” ๊ฒƒ์ด๋‹ˆ ์•„๋ž˜์™€ ๊ฐ™์€ ๊ทน๋‹จ์ ์ธ ํ™•๋ฅ ์˜ ๋‹จ์–ด๊ฐ€ ๋‚˜์˜ฌ ์ˆ˜๋„ ์žˆ๋‹ค. (์•„๋ž˜์™€ ๊ฐ™์€ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋Š” ํ™•๋ฅ ์€ ๋Œ€๋žต 0.6%) ๋‘๋ฒˆ์งธ์˜ ๊ทน๋‹จ์ ์ธ ์˜ˆ์‹œ๊ฐ€ ์•„๋‹Œ, ์ฒซ๋ฒˆ์งธ ์˜ˆ์‹œ์™€ ๊ฐ™์€ ๊ฒฐ๊ณผ๋กœ ํ† ํ”ฝ์ด ์ •ํ•ด์กŒ๋‹ค๊ณ  ํ•˜์ž.
  6. ๊ฐ ๋‹จ์–ด์˜ ํ† ํ”ฝ์— ๋งž์ถฐ์„œ ์‹ค์ œ ๋‹จ์–ด๋“ค์„ ์„ ํƒํ•ด์•ผํ•œ๋‹ค. 1์ด๋ผ๊ณ  ์จ์ ธ์žˆ๋Š” ๊ณณ์€

    80%์˜ ํ™•๋ฅ ๋กœ ๊ณ ์–‘์ด๊ฐ€ ๋ ๊ฒƒ์ด๊ณ  2๋ผ๊ณ  ์“ฐ์—ฌ์ง„ ๊ณณ์€ 90%์˜ ํ™•๋ฅ ๋กœ ๊ฐœ๊ฐ€ ๋ ๊ฒƒ์ด๋‹ค. 1 2 1 2 2 1 1 2 2 2 ๊ณ ์–‘์ด ๊ฐœ ๊ณ ์–‘์ด ๊ฐœ ๊ฐœ ๊ณ ์–‘์ด ๊ณ ์–‘์ด ๊ฐœ ๊ฐœ ๊ณ ์–‘์ด ์ด์ฒ˜๋Ÿผ ํ† ํ”ฝ๋ณ„ ๋‹จ์–ด ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ ์ •ํ•ด์ง€๊ณ , ๊ฐ ๋ฌธ์„œ๋ณ„๋กœ ํ† ํ”ฝ์ด ์ •ํ•ด์กŒ์„ ๊ฒฝ์šฐ, LDA ํ† ํ”ฝ ๋ชจ๋ธ์€ ๋ฌธ์„œ๋Š” ๋ฌธ์„œ์˜ ํ† ํ”ฝ ํ™•๋ฅ ์— ๋”ฐ๋ผ ๋‹จ์–ด์˜ ํ† ํ”ฝ์„ ์ •ํ•˜๊ณ , ํ† ํ”ฝ์˜ ๋‹จ์–ด ํ™•๋ฅ ์— ๋”ฐ๋ผ ๊ฐ ํ† ํ”ฝ ๋‹จ์–ด๋ฅผ ์‹ค์ œ ๋‹จ์–ด๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•œ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด LDA ๋ชจ๋ธ๋ง์€ ๊ฐ ํ† ํ”ฝ์˜ ๋‹จ์–ด ํ™•๋ฅ  ๋ถ„ํฌ์™€, ๊ฐ ๋ฌธ์„œ์˜ ํ† ํ”ฝ ํ™•๋ฅ  ๋ถ„ํฌ๋Š” ์–ด๋–ค ๊ณผ์ •์œผ๋กœ ์ •ํ•ด์ง„๋‹ค๊ณ  ๊ฐ€์ •ํ• ๊นŒ? ํ† ํ”ฝ ๋ชจ๋ธ๋ง์€ ํ† ํ”ฝ์˜ ๋‹จ์–ด ํ™•๋ฅ  ๋ถ„ํฌ์™€, ๊ฐ ๋ฌธ์„œ๋ณ„ ํ† ํ”ฝ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ Dirchlet ๋ถ„ํฌ ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด ๋žœ๋คํ•˜๊ฒŒ ์ •ํ•œ๋‹ค.
  7. Drichlet ๋ถ„ํฌ๋ž€? Dir n์ด๋ผ๋Š” ์ˆ˜๊ฐ€ ์ฃผ์–ด์กŒ์„๋•Œ n๊ฐœ์˜ ์—˜๋ฆฌ๋จผํŠธ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”

    ๋ฒกํ„ฐ๋ฅผ ๋žœ๋คํ•˜๊ฒŒ ์ƒ์‚ฐํ•˜๋Š”๋ฐ ์‚ฌ์šฉ๋˜๋Š” ํ™•๋ฅ  ๋ถ„ํฌ์ด๋‹ค. ์ƒ์„ฑ๋˜๋Š” ๋žœ๋ค ๋ณ€์ˆ˜์ธ ๋ฒกํ„ฐ์˜ ์—˜๋ฆฌ๋จผํŠธ์˜ ํ•ฉ์€ 1์ด๊ณ  ๊ฐ ์—˜๋ฆฌ๋จผํŠธ๋Š” 0 ์ด์ƒ์˜ ๊ฐ’ใ…‡๋ฅด ๊ฐ–๋Š”๋‹ค. ์˜ˆ. n= 2์ธ ๊ฒฝ์šฐ (0.5, 0.5), (0.32, 0.68) ๋“ฑ์ด Drichlet ๋ถ„ํฌ๋กœ ์ƒ์„ฑ๋  ์ˆ˜ ์žˆ๋Š” ๋žœ๋ค๋ณ€์ˆ˜์˜ ๊ฐ’์ด๋‹ค. (2, -1), (23, 24), (0.1, 1.1) ๋“ฑ์€ ์ƒ์„ฑ๋  ์ˆ˜ ์—†๋Š” ๊ฐ’์ด๋‹ค.
  8. Drichlet ๋ถ„ํฌ์˜ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ Dir(a) ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ a๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค.

    a๊ฐ€ ๋†’์œผ๋ฉด ๋†’์„์ˆ˜๋ก ๊ฐ ์—˜๋ฆฌ๋จผํŠธ์˜ ๊ฐ’์€ ๊ท ๋“ฑํ•˜๊ฒŒ ๋ถ„๋ฐฐ๋  ํ™•๋ฅ ์ด ๋†’๋‹ค. ์˜ˆ๋ฅผ๋“ค์–ด n=2์ธ ๊ฒฝ์šฐ, ๋ฒกํ„ฐ๋ฅผ ๋žœ๋คํ•˜๊ฒŒ ์ƒ์„ฑํ• ๋•Œ, a์˜ ๊ฐ’์ด ๋†’์œผ๋ฉด ๋†’์„ ์ƒ์„ฑ๋˜๋Š” ๋žœ๋ค ๋ฒกํ„ฐ๋Š” (0.5, 0.5) ์— ๊ฐ€๊นŒ์›Œ์งˆ ํ™•๋ฅ ์ด ๋†’์•„์ง„๋‹ค.
  9. ์˜ˆ. Beta ๋ถ„ํฌ, 2 ์ฐจ์› ๋ฒกํ„ฐ์ธ Drichlet ๋ถ„ํฌ a= 1

    ๋ชจ๋“  ๋ฒกํ„ฐ๊ฐ€ ๋™์ผํ•œ ํ™•๋ฅ ์„ ๊ฐ–๋Š”๋‹ค. Uniform ๋ถ„ํฌ์™€ ๋‹ค๋ฅผ ๋ฐ”์—†๋‹ค. a = 10 a=1๊ณผ ๋‹ฌ๋ฆฌ (0.5, 0.5)๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๋ชฐ๋ ค์žˆ๋‹ค. a= 100 2์ฐจ์› ๋ฒกํ„ฐ์ด๋‹ˆ, ์—˜๋ฆฌ๋จผํŠธ ํ•˜๋‚˜์˜ ๊ฐ’์ด x ์ด๋ฉด ๋‚˜๋จธ์ง€ ํ•˜๋‚˜์˜ ๊ฐ’์€ 1-x ์ด๋‹ค. ๊ทธ๋Ÿฌ๋ฏ€๋กœ ์‹ค์ƒ ๋žœ๋ค ๋ณ€์ˆ˜๋Š” ํ•˜๋‚˜๋ฐ–์— ์—†๋‹ค. ์•„๋ž˜ ๊ทธ๋ž˜ํ”„๋Š” 2์ฐจ์› ๋ฒกํ„ฐ์ค‘ ์ฒซ๋ฒ„์งธ ์—˜๋ฆฌ๋จผํŠธ์˜ ๊ฐ’์— ๋Œ€ํ•œ ํ™•๋ฅ  ๋ถ„ํฌ๋„๋ฅผ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•˜์ž.
  10. LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง์ด ์ƒ๊ฐํ•˜๋Š” ๋ฌธ์„œ๊ฐ€ ๋งŒ๋“ค์–ด์ง€๋Š” ๊ณผ์ • 1. ํ† ํ”ฝ์˜ ๊ฐœ์ˆ˜

    n์„ ์ •ํ•œ๋‹ค. 2. ํ† ํ”ฝ ์ƒ์„ฑ์‹œ์— ์‚ฌ์šฉํ•  Dirchlet ํ•จ์ˆ˜์˜ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ b๋ฅผ ์ •ํ•œ๋‹ค. 3. ๋ฌธ์„œ ์ƒ์„ฑ์‹œ์— ์‚ฌ์šฉํ•  Dirchlet ํ•จ์ˆ˜์˜ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ a๋ฅผ ์ •ํ•œ๋‹ค. 4. Dir(b)๋ฅผ ์‚ฌ์šฉํ•ด n๊ฐœ์˜ ํ† ํ”ฝ ๋ฒกํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค. ํ† ํ”ฝ์˜ ์—˜๋ฆฌ๋จผํŠธ ๊ฐœ์ˆ˜๋Š” ์‚ฌ์šฉํ•  ์œ ๋‹ˆํฌ ๋‹จ์–ด์˜ ๊ฐœ์ˆ˜์ธ๋‹ค. 5. Dir(a)๋ฅผ ์‚ฌ์šฉํ•ด ์ƒ์„ฑํ•  ๋ฌธ์„œ์˜ ํ† ํ”ฝ ํ™•๋ฅ ์„ ์ •ํ•œ๋‹ค. 6. ๋ฌธ์„œ์˜ ํ† ํ”ฝ ํ™•๋ฅ ์— ๋”ฐ๋ผ ๋ฌธ์„œ์— ๋‚˜์˜ค๋Š” ๋‹จ์–ด์˜ ํ† ํ”ฝ์„ ์ •ํ•œ๋‹ค. 7. ๋ฌธ์„œ์— ์žˆ๋Š” ๋‹จ์–ด๋“ค์˜ ํ† ํ”ฝ์— ๋”ฐ๋ผ ์‹ค์ œ ๋‹จ์–ด๋ฅผ ์ •ํ•œ๋‹ค.
  11. ์˜ˆ์‹œ. 1. ํ† ํ”ฝ 1์„ Dirchlet ๋žœ๋คํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด ์ƒ์„ฑ. T1 ~Dir(b)

    ๊ฐœ ๊ณ ์–‘์ด ์ƒˆ T1 0.2 0.7 0.1 2. ํ† ํ”ฝ 2๋„ ์ƒ์„ฑ T2 ~Dir(b) ๊ฐœ ๊ณ ์–‘์ด ์ƒˆ T2 0.5 0.1 0.4 ๊ฐœ, ๊ณ ์–‘์ด, ์ƒˆ 3๊ฐœ์˜ ๋‹จ์–ด๋งŒ ์‚ฌ์šฉํ•œ๋‹ค. ์ƒ์„ฑํ•˜๋Š” ๋ฌธ์„œ๋Š” D1(2 ๋‹จ์–ด), D2( 4 ๋‹จ์–ด) 2๊ฐœ ๊ฐœ ๊ณ ์–‘์ด ์ƒˆ T1 0.2 0.7 0.1 T2 0.5 0.1 0.4 ์ตœ์ข… ๊ฒฐ๊ณผ
  12. 3. ๋ฌธ์„œ D1 ์˜ ํ† ํ”ฝ ํ™•๋ฅ  ๋ถ„ํฌ๋„๋ฅผ ์ •ํ•œ๋‹ค. D1 ~

    Dir(a) D1 T1 T2 40% 60% 4. D1์˜ ๋‹จ์–ด๋“ค์˜ ํ† ํ”ฝ์„ ์œ„์˜ ํ™•๋ฅ ์— ๋งž์ถฐ์„œ ์ •ํ•œ๋‹ค. D1 2 1 5. D1์˜ ๋‹จ์–ด๋ฅผ ํ† ํ”ฝ์˜ ํ™•๋ฅ ์— ๋งž์ถฐ์„œ ์„ ํƒํ•œ๋‹ค. D1 ์ƒ์„ฑ ์™„๋ฃŒ D1 ํ† ํ”ฝ 2 1 D1 ๋‹จ์–ด ์ƒˆ ๊ณ ์–‘์ด
  13. 6. ๋ฌธ์„œ D2 ์˜ ํ† ํ”ฝ ํ™•๋ฅ  ๋ถ„ํฌ๋„๋ฅผ ์ •ํ•œ๋‹ค. D2 ~

    Dir(a) T1 T2 D2 10% 90% 4. D2์˜ ๋‹จ์–ด๋“ค์˜ ํ† ํ”ฝ์„ ์œ„์˜ ํ™•๋ฅ ์— ๋งž์ถฐ์„œ ์ •ํ•œ๋‹ค. D2 2 2 2 2 5. D2์˜ ๋‹จ์–ด๋ฅผ ํ† ํ”ฝ์˜ ํ™•๋ฅ ์— ๋งž์ถฐ์„œ ์„ ํƒํ•œ๋‹ค. D1 ์ƒ์„ฑ ์™„๋ฃŒ D2 ํ† ํ”ฝ 2 2 2 2 D2 ๊ฐœ ์ƒˆ ์ƒˆ ์ƒˆ
  14. LDA ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ง€๊ธˆ๊นŒ์ง€์˜ ์„ค๋ช…์€ LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง์ด ์–ด๋– ํ•œ ๊ฐ€์ •ํ•˜๊ณ  ์žˆ๋Š”

    ๋ฌธ์„œ์˜ ์ƒ์„ฑ๊ณผ์ •์ด๋‹ค. LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ํ† ํ”ฝ์˜ ๊ฐœ์ˆ˜, ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ a,b ๊ทธ๋ฆฌ๊ณ  ๋ฌธ์„œ๊ฐ€ ์ฃผ์–ด์กŒ์„๋•Œ, ํ˜„์žฌ ์ฃผ์–ด์ง„ ๋ฌธ์„œ๋ฅผ ์ƒ์„ฑํ•  ํ™•๋ฅ ์ด ๊ฐ€์žฅ ๋†’์€ ํ† ํ”ฝ๊ณผ ๋ฌธ์„œ์˜ ํ† ํ”ฝ ๊ตฌ์„ฑ๋ฅ ์„ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด ๋ชฉ์ ์ด๋‹ค.
  15. ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ฌธ์„œ 2๊ฐœ๊ฐ€ ์žˆ๋‹ค. D1 ์ƒˆ ๊ณ ์–‘์ด D2 ๊ฐœ

    ์ƒˆ ์ƒˆ ์ƒˆ 2๊ฐœ์˜ ํ† ํ”ฝ์ด ์žˆ๋‹ค๋Š” ๊ฐ€์ •ํ•˜์— ํ† ํ”ฝ์˜ ๋‹จ์–ด ๊ตฌ์„ฑ๋ฅ ๊ณผ ๊ฐ ๋ฌธ์„œ์˜ ํ† ํ”ฝ ๊ตฌ์„ฑ๋ฅ ์ด ์–ด๋–ป๊ฒŒ ๋˜์•ผ ์œ„ ๋ฌธ์„œ๋“ค์ด ๋งŒ๋“ค์–ด์งˆ ํ™•๋ฅ ์ด ๊ฐ€์žฅ ๋†’์„๊นŒ?
  16. D1 ๋‹จ์–ด ์ƒˆ ๊ณ ์–‘์ด D2 ๋‹จ์–ด ๊ฐœ ์ƒˆ ์ƒˆ ์ƒˆ

    ๊ฐœ ๊ณ ์–‘์ด ์ƒˆ T1 ? ? ? T2 ? ? ? T1 T2 D1 ? ? D2 ? ? ์œ„์˜ ๋‘ ํ‘œ๋ฅผ ์–ด๋–ป๊ฒŒ ์ฑ„์›Œ ๋„ฃ์–ด์•ผ. ์•„๋ž˜ ๋‘ ๋ฌธ์„œ๊ฐ€ ๋‹ค์‹œ ์ƒ์„ฑ๋  ํ™•๋ฅ ์ด ๊ฐ€์žฅ ๋†’์„๊นŒ?
  17. ๋ฒ ์ด์ฆˆ ์ถ”๋ก  ์‚ฌ์ „ ํ™•๋ฅ ์ด ์žˆ์„๋•Œ ์‚ฌํ›„ ํ™•๋ฅ ์„ ์ถ”๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ• Lda

    ํ† ํ”ฝ ๋ชจ๋ธ๋ง์€ ์ฃผ์–ด์ง„ ๋ฌธ์„œ์— ๋Œ€ํ•œ ์‚ฌํ›„ ํ™•๋ฅ ์„ ์ถ”๋ก ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค.
  18. ๊ฐ„๋‹จํ•œ ๋ฒ ์ด์ฆˆ ์ถ”๋ก  ์˜ˆ์‹œ. ๊ตํ†ต ์‚ฌ๊ณ ๊ฐ€ ์ž์ฃผ ๋‚˜๋Š” ํ•œ ์žฅ์†Œ๊ฐ€

    ์žˆ๋‹ค. ์—ฌ๊ธฐ๋ฅผ ์ง€๋‚˜๊ฐ€๋Š” ์ž๋™์ฐจ๋“ค์€ 20%์˜ ํ™•๋ฅ ๋กœ ์šด์ „์ž๊ฐ€ ์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•œ๋‹ค. 80% 20% 10% 70% ์•ˆ์ „๋ฒจํŠธ๋ฅผ ํ•œ ์‚ฌ๋žŒ๋“ค์€ 10% ์˜ ํ™•๋ฅ ๋กœ ์‚ฌ๊ณ ๊ฐ€ ๋‚œ๋‹ค. ์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•œ ์‚ฌ๋žŒ๋“ค์€ 70%์˜ ํ™•๋ฅ ๋กœ ์‚ฌ๊ณ ๊ฐ€ ๋‚œ๋‹ค.
  19. ์ด ๊ฒฝ์šฐ ์ด ์žฅ์†Œ๋ฅผ ์ง€๋‚˜๊ฐ€๋Š” ์šด์ „์ž๋“ค์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ถ„ํฌ๋„๋ฅผ ๊ฐ€์ง„๋‹ค.

    ์•ˆ์ „๋ฒจํŠธ ์ฐฉ์šฉ ์—ฌ๋ถ€ ์‚ฌ๊ณ  ์—ฌ๋ถ€ ๋น„์œจ O O 0.8 *0.1 *100 = 8% O X 0.8 * 0.9 * 100 = 72% X O 0.2 * 0.7 * 100 = 14 % X X 0.2 * 0.3 * 100 = 6% ๊ทธ๋ ‡๋‹ค๋ฉด ์ด ์žฅ์†Œ์—์„œ ์ง€๋‚˜๊ฐ„ ์ž๋™์ฐจ ํ•˜๋‚˜๊ฐ€ ์‚ฌ๊ณ ๊ฐ€ ๋‚ฌ๋‹ค. ์ด ๊ฒฝ์šฐ ์ž๋™์ฐจ ์•ˆ์„ ํ™•์ธ ํ–ˆ์„๋•Œ ์šด์ „์ž๊ฐ€ ์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•˜๊ณ  ์žˆ์„ ํ™•๋ฅ ์€ ์–ด๋–ป๊ฒŒ ๋˜๋Š”๊ฐ€? P(์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•˜๊ณ  ์žˆ์„ ํ™•๋ฅ  | ์‚ฌ๊ณ ๊ฐ€ ์ผ์–ด๋‚ฌ๋‹ค)
  20. P(์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•˜๊ณ  ์žˆ์„ ํ™•๋ฅ  | ์‚ฌ๊ณ ๊ฐ€ ์ผ์–ด๋‚ฌ๋‹ค) = (์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•˜๊ณ 

    ์‚ฌ๊ณ ๋‚  ํ™•๋ฅ ) / (์‚ฌ๊ณ ๋‚  ํ™•๋ฅ ) = (์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•˜๊ณ  ์‚ฌ๊ณ ๋‚  ํ™•๋ฅ ) / (์•ˆ์ „๋ฒจํŠธ๋ฅผ ํ•˜๊ณ  ์‚ฌ๊ณ ๋‚  ํ™•๋ฅ  + ์•ˆ์ „๋ฒจํŠธ ์•ˆํ•˜๊ณ  ์‚ฌ๊ณ ๋‚  ํ™•๋ฅ ) = 14 / (14 + 8) = 14 /22 = 7 / 11 ~= 0.63 ์‚ฌ๊ณ ๋‚ธ ์šด์ „์ž๊ฐ€ ์•ˆ์ „๋ฒจํŠธ๋ฅผ ์•ˆํ•˜๊ณ  ์žˆ์„ ํ™•๋ฅ ์€ 63%๊ฐ€ ๋œ๋‹ค.
  21. LDA ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ•™์Šต ๋ฐฉ์‹ - Variational inference Gradient decent ๋Š”

    ๋”ฅ๋Ÿฌ๋‹๋“ฑ ๋งŽ์€ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์—์„œ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ฃผ์–ด์ง„ ์ ์ˆ˜ ๊ณต์‹์— ๋Œ€ํ•ด ๊ฐ€์žฅ ๋†’์€ ์ ์ˆ˜๋ฅผ ์ฐพ์•„๋‚ด๋Š” ์ธํ’‹์„ ์ฐพ์•„๋‚ธ๋‹ค. ํ˜„์žฌ ์ธํ’‹์—์„œ ๊ฐ€์žฅ ๊ฒฝ์‚ฌ์ง„ ๋ฐฉํ–ฅ์„ ์ฐพ์•„๋‚ด์–ด ๊ทธ ๋ฐฉํ–ฅ์œผ๋กœ ์ธํ’‹์„ ์ˆ˜์ •ํ•˜๋Š” ๊ฒƒ์„ ๋ฐ˜๋ณตํ•˜์—ฌ ์ตœ์ ์˜ ๊ฐ’์— ๋„๋‹ฌํ•œ๋‹ค.
  22. ๊ทธ๋Ÿฌ๋‹ˆ LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง์—์„œ๋Š” ํ† ํ”ฝ T, ๊ทธ๋ฆฌ๊ณ  ๊ฐ ๋ฌธ์„œ์˜ ํ† ํ”ฝ

    ๊ตฌ์„ฑ๋ฅ  D์— ๋Œ€ํ•ด ์ฃผ์–ด์ง„ ๋ฌธ์„œ W๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ  ๊ณต์‹์€ gradient๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค. P(W|T, D, a, b) โ†’ gradient is intraceable ๊ทธ๋ ‡๊ธฐ์— Variational Inference๋ผ๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•ด ์ •ํ™•ํ•œ P(W|T, D, a, b)์˜ ๊ฐ’์ด ์•„๋‹Œ P(W|T, D, a, b)์˜ lower bound๊ฐ€ ๋˜๋Š” ๊ฐ’์„ ๊ตฌํ•ด grandeint decent๋ฅผ ์ ์šฉํ•œ๋‹ค. ์ž์„ธํ•œ ๋‚ด์šฉ์€ http://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf๋ฅผ ์ฐธ์กฐ
  23. LDA ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ•™์Šต ๋ฐฉ์‹ - Gibbs ์ƒ˜ํ”Œ๋ง ๊ฐ ํ† ํ”ฝ์˜ ๋‹จ์–ด

    ๋น„์œจ๊ณผ ๋ฌธ์„œ ๋น„์œจ ๋ณด๋‹ค๋Š” ๊ฐ ๋ฌธ์„œ์˜ ๋‹จ์–ด์˜ ํ† ํ”ฝ ๊ฐ’์„ ์•Œ์•„๋‚ด๊ณ ์ž ํ•˜๋Š” ๊ธฐ๋ฒ•. D1 ํ† ํ”ฝ ? ? D1 ๋‹จ์–ด ์ƒˆ ๊ณ ์–‘์ด D2 ํ† ํ”ฝ ? ? ? ? D2 ๋‹จ์–ด ๊ฐœ ์ƒˆ ์ƒˆ ์ƒˆ ์œ„์˜ ๊ฐ’์„ ์ฑ„์›Œ ๋„ฃ์œผ๋ฉด, ํ† ํ”ฝ์˜ ๋‹จ์–ด ๋น„์œจ๊ณผ ๊ฐ ๋ฌธ์„œ์˜ ํ† ํ”ฝ ๋น„์œจ์€ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์ตœ์ ์˜ ๊ฐ’์„ ์•Œ์•„๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ๊ฐ ๋‹จ์–ด๊ฐ€ ๊ฐ ํ† ํ”ฝ์— ํ• ๋‹น๋œ ํšŸ์ˆ˜๋ฅผ ์นด์šดํŒ…ํ›„ ๊ทธ ๋น„์œจ์„ ๊ตฌํ•˜๋ฉด ํ† ํ”ฝ์˜ ๋‹จ์–ด ๋ถ„ํฌ๋„๊ฐ€ ๋‚˜์˜จ๋‹ค. ๊ฐ ๋ฌธ์„œ์—์„œ ๊ฐ ํ† ํ”ฝ์ด ํ• ๋‹น๋œ ํšŸ์ˆ˜๋ฅผ ์นด์šดํŒ…ํ›„ ๊ทธ ๋น„์œจ์„ ๊ตฌํ•˜๋ฉด ๋ฌธ์„œ์˜ ํ† ํ”ฝ ๋ถ„ํฌ๋„๊ฐ€ ๋‚˜์˜จ๋‹ค.
  24. LDA ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ•™์Šต ๋ฐฉ์‹ - Gibbs ์ƒ˜ํ”Œ๋ง ๊ฐ€๋Šฅ ํ•œ ๋ชจ๋“ 

    ์กฐํ•ฉ์— ๋Œ€ํ•œ ํ™•๋ฅ ์„ ๊ตฌํ•œํ›„ ๊ฐ€์žฅ ๋†’์€ ํ™•๋ฅ ์„ ๊ฐ–๋Š” ํ† ํ”ฝ ํ• ๋‹น์„ ์„ ํƒํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋น„ํ˜„์‹ค ์ ์ด๋‹ค. ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ์กฐํ•ฉ์˜ ์ˆ˜๋Š” ๋‹จ์–ด ์ˆ˜์— ๋”ฐ๋ผ ๊ฐ€ํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ๋Š˜์–ด๋‚œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‹จ ํ•œ๋‹จ์–ด๋ฅผ ์ œ์™ธํ•˜๊ณ  ๋ชจ๋“  ๋‹จ์–ด์— ํ† ํ”ฝ์„ ํ• ๋‹นํ•œํ›„, ๋‚˜๋จธ์ง€ ํ•œ๋‹จ์–ด์— ๋“ค์–ด๊ฐˆ ํ† ํ”ฝ์˜ ํ™•๋ฅ ์„ ๊ตฌํ•˜๋Š” ๊ฒƒ์€ ์†์‰ฝ๋‹ค.
  25. D1 ํ† ํ”ฝ 1 2 D1 ๋‹จ์–ด ์ƒˆ ๊ณ ์–‘์ด D2 ํ† ํ”ฝ

    1 1 1 ? D2 ๋‹จ์–ด ๊ฐœ ์ƒˆ ์ƒˆ ์ƒˆ ์˜ˆ. ์•„๋ž˜์™€ ๊ฐ™์ด D2์— ์žˆ๋Š” ๋‹จ ํ•œ ๋‹จ์–ด ๋งŒ ์ œ์™ธํ•˜๊ณ  ๋‹ค๋ฅธ ๋‹จ์–ด๋“ค์˜ ํ† ํ”ฝ์ด ๋ฌด์—‡์ธ์ง€ ์•Œ๊ณ  ์žˆ์„ ๊ฒฝ์šฐ D1์˜ ํ† ํ”ฝ์ด, x1, x2์ด๊ณ , D2์˜ ํ† ํ”ฝ์ด y1, y2, y3, y4์ผ ํ™•๋ฅ ์„ p(D1=(x1, x2), D2=(y1,y2,y3,y4)) ๋ผ๊ณ  ํ• ๋•Œ ๋ฒ ์ด์ฆˆ ์ถ”๋ก ์— ์˜ํ•ด D2์˜ ๋งˆ์ง€๋ง‰ ๋‹จ์–ด์˜ ํ† ํ”ฝ์ด x์ผ ํ™•๋ฅ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
  26. ๋งˆ์ง€๋ง‰ ๋‹จ์–ด์˜ ํ† ํ”ฝ์ด i์ผ ํ™•๋ฅ ์€ ๋‹ค์Œ ๊ณต์‹๊ณผ p(i)์™€ ๋น„๋ก€ํ•œ๋‹ค. ์ด

    ๊ณต์‹์˜ ์ž์„ธํ•œ ๊ณ„์‚ฐ๋ฒ•์€ ๋‹ค์Œ ๋…ผ๋ฌธ์— ๋‚˜์™€์žˆ๋‹ค. http://www.pnas.org/content/pnas/101/suppl_1/5228.full.pdf ษ‘์™€ ๋Š” ๋ฌธ์„œ์™€ ํ† ํ”ฝ์˜ Dirchlet ํ•จ์ˆ˜์˜ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ ์ด๋‹ค.
  27. ๋ณดํ†ต ษ‘ = 50 / (ํ† ํ”ฝ ๊ฐœ์ˆ˜) = (200/ ์œ ๋‹ˆํฌํ•œ

    ๋‹จ์–ด์ˆ˜) or b= 0.1 ๊ฐ€ ๋งŽ์ด ์“ฐ์ธ๋‹ค. ษ‘= 50/( ํ† ํ”ฝ ๊ฐœ์ˆ˜) = 25 = 200 / (์œ ๋‹ˆํฌํ•œ ๋‹จ์–ด์ˆ˜) ~= 67 ๋กœ ํ• ๊ฒฝ์šฐ p(2) = 0.15๊ฐ€ ๋˜๋ฉฐ p(1)์€ 0.17์ด ๋œ๋‹ค. ๊ทธ๋Ÿฌ๋ฏ€๋กœ ๋งˆ์ง€๋ง‰ ๋‹จ์–ด์ธ ์ƒˆ๊ฐ€ 2์ผ ํ™•๋ฅ  ์ ์ˆ˜๋Š” 0.15 ์ด๋ฉฐ 1์ด๋  ํ™•๋ฅ  ์ ์ˆ˜๋Š” 0.15 ์ด๋‹ค. D2์˜ ํ† ํ”ฝ ๋ฏธ์ง€์ • ๋‹จ์–ด์ธ ์ƒˆ์˜ ํ† ํ”ฝ์ด 1์ด ๋  ํ™•๋ฅ ์€ (0.17 / 0.31) * 100 ~= 58% ์ด๊ณ  2๊ฐ€ ๋  ํ™•๋ฅ ์€ 42%์ด๋‹ค.
  28. ๊ทธ๋ฆฌ๊ณ  ์œ„์˜ ํ™•๋ฅ ๋Œ€๋กœ D2์˜ ๋งˆ์ง€๋ง‰ ๋‹จ์–ด์ธ ์ƒˆ์˜ ํ† ํ”ฝ์„ ํ• ๋‹นํ•œ๋‹ค. ์ด

    ๊ฒƒ์„ ๋ฌธ์„œ๋‚ด์˜ ๋ชจ๋“  ๋‹จ์–ด์— ๋ฐ˜๋ณตํ•˜์—ฌ ๋ชจ๋“  ๋‹จ์–ด๋“ค์˜ ํ† ํ”ฝ์„ ์žฌํ• ๋‹น ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด ์‚ฌ์ดํด์„ ๋‹ค์‹œ ๋งŽ์€ ์ˆ˜ ๋ฐ˜๋ณตํ•˜๋Š” ๊ฒƒ์ด ๊น์Šค ์ƒ˜ํ”Œ๋ง์ด๋‹ค. ์ด ์‚ฌ์ดํด์„ ๋งŽ์€ ์ˆ˜ ๋ฐ˜๋ณตํ•˜๋ฉด, ๊ฐ ๋‹จ์–ด์— ํ• ๋‹น๋œ ํ† ํ”ฝ์€ ๊ฐ€์žฅ ์ ์ ˆํ•œ ํ† ํ”ฝ๋“ค์ด ๋ ๊ฒƒ์ด๊ณ , ๊ฐ ๋ฌธ์„œ ๋‚ด์˜ ํ• ๋‹น๋œ ํ† ํ”ฝ ์ˆ˜์˜ ๋ฒกํ„ฐ์™€, ํ† ํ”ฝ๋ณ„ ๋‹จ์–ด ์ˆ˜๊ฐ€ ์ผ์ •ํ•˜๊ฒŒ ์ˆ˜๋ ดํ•˜๊ฒŒ ๋˜๊ณ , ์ด๋ ‡๊ฒŒ ํ•ด์„œ ๊ตฌํ•œ ํ† ํ”ฝ์˜ ๋‹จ์–ด ๋น„์œจ๊ณผ ๋ฌธ์„œ์˜ ํ† ํ”ฝ ๋น„์œจ์ด ๊ฐ€์žฅ ์ ์ ˆํ•œ ๋น„์œจ์— ๊ฐ€๊นŒ์›Œ์ง€๊ฒŒ ๋œ๋‹ค.
  29. Variational Inference VS Gibbs sampling ์ฒ˜์Œ ํ† ํ”ฝ ๋ชจ๋ธ๋ง ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋ฐœํ‘œํ•œ

    ๋…ผ๋ฌธ์—์„œ ์‚ฌ์šฉ๋œ ๊ฒƒ์€ VI ์˜€์œผ๋‚˜, ๋น ๋ฅธ ํ•™์Šต์†๋„๋กœ ์ธํ•ด ๋Œ€๊ฐœ๋Š” Gibbs sampling์ด ์„ ํ˜ธ๋œ๋‹ค. ์•„๋ž˜๋Š” a์˜ ํ† ํ”ฝ๋“ค๊ณผ b์˜ ๋ฌธ์„œ๋ฅผ ์ƒ์„ฑํ›„, ๋‹ค์‹œ Gibbs ์ƒ˜ํ”Œ๋ง์„ ์ด์šฉํ•ด ํ† ํ”ฝ์„ ๋ณต์›ํ•œ ๊ณผ์ •์ด๋‹ค.