Upgrade to PRO for Only $50/Yearโ€”Limited-Time Offer! ๐Ÿ”ฅ

PRML Chapter 9

Avatar for shogo-d-nakamura shogo-d-nakamura
November 01, 2023

PRML Chapterย 9

PRML, Pattern Recognition and Machine Learning
chapter 9

Avatar for shogo-d-nakamura

shogo-d-nakamura

November 01, 2023
Tweet

More Decks by shogo-d-nakamura

Other Decks in Science

Transcript

  1. 9. ๆททๅˆใƒขใƒ‡ใƒซใจEM โ€ข ่ฆณๆธฌๅค‰ๆ•ฐใจๆฝœๅœจๅค‰ๆ•ฐใฎๅŒๆ™‚ๅˆ†ๅธƒใ‚’ๅฎš็พฉใ™ใ‚Œใฐใ€ๅ‘จ่พบๅŒ–ใซใ‚ˆใฃใฆ่ฆณๆธฌๅค‰ๆ•ฐใ ใ‘ใฎๅˆ†ๅธƒ๏ผˆๅ‘จ ่พบๅˆ†ๅธƒ๏ผ‰ใŒๅพ—ใ‚‰ใ‚Œใ‚‹ใ€‚ โ€ข ๆฏ”่ผƒ็š„่ค‡้›‘ใช่ฆณๆธฌๅค‰ๆ•ฐใฎๅ‘จ่พบๅˆ†ๅธƒใ‚’ใ€่ฆณๆธฌๅค‰ๆ•ฐใจๆฝœๅœจๅค‰ๆ•ฐใฎๅŒๆ™‚ๅˆ†ๅธƒใซใ‚ˆใฃใฆ่กจใ™ใ“ใจ ใงใ€ใ‚ˆใ‚Šๆ‰ฑใ„ใ‚„ใ™ใใงใใ‚‹๏ผˆ9.2~9.3๏ผ‰ใ€‚ โ€ข ๆททๅˆใƒขใƒ‡ใƒซใฎ่ชฌๆ˜ŽใฎใŸใ‚

    K-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ(9.1)ใซใคใ„ใฆ่ซ–ใ˜ใŸๅพŒใ€EMใ‚ขใƒซใ‚ดใƒช ใ‚บใƒ ใซใคใ„ใฆ่ชฌๆ˜Žใ—ใ€K-meansใŒๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใซๅฏพใ™ใ‚‹EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎ้ž็ขบ็އ็š„ๆฅต ้™ใจใ—ใฆ่งฃ้‡ˆใงใใ‚‹ใ“ใจใ‚’่ฆ‹ใ‚‹(9.3)ใ€‚ โ€ข ๆœ€ๅพŒใซใ€EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใŒๅธธใซๅฐคๅบฆใ‚’ๅข—ๅŠ ใ•ใ›ใ‚‹ไบ‹ใซใคใ„ใฆ่ชฌๆ˜Žใ™ใ‚‹(9.4)ใ€‚ 3/56
  2. 9.1 K-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ โ€ข Dๆฌกๅ…ƒใƒฆใƒผใ‚ฏใƒชใƒƒใƒ‰็ฉบ้–“ไธŠใฎใƒ‡ใƒผใ‚ฟ้›†ๅˆ {๐ฑ1 , ๐ฑ2 , โ€ฆ ๐ฑ๐‘

    } ใซใคใ„ใฆใ€ใ“ใ‚Œใ‚‰ใฎใƒ‡ใƒผใ‚ฟ็‚นใ‚’ K ๅ€‹ใฎใ‚ฏใƒฉใ‚นใ‚ฟใซๅˆ†ๅ‰ฒใ™ใ‚‹ใ“ใจใ‚’่€ƒใˆใ‚‹ใ€‚ - ใพใšใฏใ‚ฏใƒฉใ‚นใ‚ฟๆ•ฐKใŒๆ—ข็Ÿฅใงใ‚ใ‚‹ๅ ดๅˆใ‚’ๆƒณๅฎšใ™ใ‚‹ใ€‚ โ€ข ใ‚ฏใƒฉใ‚นใ‚ฟใฎๅนณๅ‡ใƒ™ใ‚ฏใƒˆใƒซใฎ้›†ๅˆ {๐œ‡๐‘˜ } ใ‚’ๅฐŽๅ…ฅใ™ใ‚‹ใ€‚ โ€ข {๐œ‡๐‘˜ } ใ‚’้ฉๅˆ‡ใซๅฎšใ‚ใ€ๅ„ใƒ‡ใƒผใ‚ฟ็‚นใ‚’ใ†ใพใๅ„ใ‚ฏใƒฉใ‚นใ‚ฟใซๅฏพๅฟœใ•ใ›ใ€ๅ„ใƒ‡ใƒผใ‚ฟ็‚นใ‹ใ‚‰ๅฏพๅฟœใ™ ใ‚‹ใ‚ฏใƒฉใ‚นใ‚ฟใฎๅนณๅ‡ ๐œ‡๐‘˜ ใธใฎไบŒไน—่ท้›ขใฎ็ทๅ’Œใ‚’ๆœ€ๅฐๅŒ–ใ™ใ‚‹ใ“ใจใŒ็›ฎ็š„ใ€‚ โ€ข ไปฅไธŠใ‹ใ‚‰็›ฎ็š„้–ขๆ•ฐ ๐ฝ ใ‚’ไปฅไธ‹ใฎใ‚ˆใ†ใซ่จญ่จˆใ—ใŸใ€‚ - ใƒ‡ใƒผใ‚ฟ็‚น ๐ฑ๐‘› ใŒใ‚ฏใƒฉใ‚นใ‚ฟ ๐‘˜ ใซๅฑžใ™ใ‚‹ๅ ดๅˆ ๐‘Ÿ๐‘›๐‘˜ = 1ใ€ใใ‚Œไปฅๅค–ใฏ๐‘Ÿ๐‘›๐‘˜ = 0 - ็›ฎ็š„้–ขๆ•ฐ ๐ฝ ใฏๆญชใฟๅฐบๅบฆใจๅ‘ผใฐใ‚Œใ‚‹ใ“ใจใ‚‚ใ‚ใ‚‹ (9.1) 4/56
  3. 9.1 K-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ โ€ข ็›ฎ็š„้–ขๆ•ฐ ๐ฝ ใ‚’ๆœ€ๅฐๅŒ–ใ™ใ‚‹ใŸใ‚ใซใ€ไปฅไธ‹ใฎ1.ใจ2.ใ‚’็นฐใ‚Š่ฟ”ใ™ใ€‚ 1. ๐œ‡๐‘˜ ใ‚’ๅ›บๅฎšใ—ใ€ ๐‘Ÿ๐‘›๐‘˜

    ใซใคใ„ใฆ ๐ฝ ใ‚’ๆœ€ๅฐๅŒ– 2. ๐‘Ÿ๐‘›๐‘˜ ใ‚’ๅ›บๅฎšใ—ใ€ ๐œ‡๐‘˜ ใซใคใ„ใฆ ๐ฝ ใ‚’ๆœ€ๅฐๅŒ– (9.1) step 1: ๅ„ใƒ‡ใƒผใ‚ฟ็‚นใ‹ใ‚‰ๆœ€ใ‚‚่ฟ‘ใ„ใ‚ฏใƒฉใ‚นใ‚ฟไธญๅฟƒ ๐œ‡๐‘˜ ใ‚’ๆŽขใ—ใ€ใ‚ฏใƒฉใ‚นใ‚ฟ ๐‘˜ ใซๅ‰ฒใ‚Šๅฝ“ใฆใ‚‹ใ€‚ (9.2) step 2: ็›ฎ็š„้–ขๆ•ฐใ‚’ ๐œ‡๐‘˜ ใงๅพฎๅˆ†ใ—(ๅผ9.3)ใ€ๅพ—ใ‚‰ใ‚ŒใŸ่งฃใงๆ›ดๆ–ฐใ™ใ‚‹(ๅผ9.4)ใ€‚ (9.3) (9.4) 5/56
  4. 9.1 K-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ โ€ข K=2ใฎๅ…ทไฝ“ไพ‹ (a) ๐œ‡๐‘˜ ใ‚’ๅˆๆœŸๅŒ– (b) ๅ„ใƒ‡ใƒผใ‚ฟ็‚นใ‚’ๆœ€ใ‚‚่ฟ‘ใ„ใ‚ฏใƒฉใ‚นใ‚ฟใซๅˆ†้กž (๐œ‡๐‘˜

    ๅ›บๅฎšใ€ ๐‘Ÿ๐‘›๐‘˜ ๆ›ดๆ–ฐ) (c) ๅ„ใ‚ฏใƒฉใ‚นใ‚ฟใฎไธญๅฟƒใ‚’่จˆ็ฎ—ใ—็›ดใ™ (๐‘Ÿ๐‘›๐‘˜ ๅ›บๅฎšใ€ ๐œ‡๐‘˜ ๆ›ดๆ–ฐ) โ€ข ๅŽๆŸใ™ใ‚‹ใพใงๅŒๆง˜ใฎๆ“ไฝœใ‚’็นฐใ‚Š่ฟ”ใ™ใ€‚ (ๅ›ณ9.1) 6/56
  5. 9.1 K-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ โ€ข ๅ„ใ‚นใƒ†ใƒƒใƒ—ใงใฎ็›ฎ็š„้–ขๆ•ฐ ๐ฝ ใฎๆŽจ็งป (ๅ›ณ9.2) ใ€‡๏ผš๐‘Ÿ๐‘›๐‘˜ ใฎๆ›ดๆ–ฐ ใ€‡๏ผš

    ๐œ‡๐‘˜ ใฎๆ›ดๆ–ฐ ็นฐใ‚Š่ฟ”ใ—ใŸๅ›žๆ•ฐ 3ๅ›ž็›ฎใ‹ใ‚‰4ๅ›ž็›ฎใฏJใฎๅ€คใŒ ใปใจใ‚“ใฉๅค‰ใ‚ใฃใฆใ„ใชใ„ 7/56
  6. 9.1 K-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ โ€ข ็”ปๅƒๅˆ†ๅ‰ฒใฎไพ‹ - ๅณใฎ็”ปๅƒใฎใƒ”ใ‚ฏใ‚ปใƒซใฎ่‰ฒใฏ่ตคใ€็ท‘ใ€้’ใฎ ่ผๅบฆ{R, G, B}ใงๆฑบใพใ‚‹ใ€‚ -

    ๅ…ƒ็”ปๅƒใฎๅ„ใƒ”ใ‚ฏใ‚ปใƒซใซใคใ„ใฆ{R, G, B}ใฎ 3ๆฌกๅ…ƒ็ฉบ้–“ใ‚’ไฝœใ‚‹ใ€‚ - K-meansใงKๅ€‹ใซใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐใ™ใ‚‹ - ๅ„ใƒ‡ใƒผใ‚ฟ็‚น๏ผˆใƒ”ใ‚ฏใ‚ปใƒซ๏ผ‰ใŒๅฑžใ™ใ‚‹ใ‚ฏใƒฉใ‚น ใ‚ฟใฎไธญๅฟƒใƒ™ใ‚ฏใƒˆใƒซ ๐œ‡๐‘˜ ใง็”ปๅƒใ‚’ๆใ็›ดใ™ใ€‚ (ๅ›ณ9.3) 8/56
  7. 9.1 K-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ โ€ข ็”ปๅƒๅˆ†ๅ‰ฒใฏใƒ‡ใƒผใ‚ฟๅœง็ธฎใซใชใฃใฆใ„ใ‚‹ใ€‚ - ๅ…ƒ็”ปๅƒใซใคใ„ใฆใ€ใƒ”ใ‚ฏใ‚ปใƒซๆ•ฐใŒNใงใ‚ใ‚Šใ€{R, G, B} ใŒ3 x

    8ใƒ“ใƒƒใƒˆๆŒใฃใฆใ„ใ‚‹ใจใใ€1ๆžš ใฎ็”ปๅƒใ‚’้€ใ‚‹ใฎใซ24Nใƒ“ใƒƒใƒˆๅฟ…่ฆ - K-meansใ‚’้ฉ็”จใ—ใฆๅ…จใฆใฎใƒ”ใ‚ฏใ‚ปใƒซใ‚’ไปฃ่กจใƒ™ใ‚ฏใƒˆใƒซ ๐œ‡๐‘˜ ใง่กจใ—ใŸใจใใซใคใ„ใฆ่€ƒใˆใ‚‹ใ€‚ โžขๅ„ใƒ”ใ‚ฏใ‚ปใƒซใซใคใ„ใฆใ€K็จฎ้กžใฎใ‚ฏใƒฉใ‚นใ‚ฟใฎใ†ใกใฉใ‚Œใซๅฑžใ™ใ‚‹ใ‹ใ‚’่กจใ™ใฎใซ log2 K ใƒ“ใƒƒใƒˆๅฟ…่ฆใงใ‚ใ‚Šใ€ใƒˆใƒผใ‚ฟใƒซใง Nlog2 K ใƒ“ใƒƒใƒˆๅฟ…่ฆใ€‚ โžขK็จฎ้กžใฎ ๐œ‡๐‘˜ ใฎๆ•ฐๅ€คใ‚’้€ใ‚‹ใฎใซ24Kใƒ“ใƒƒใƒˆๅฟ…่ฆใ€‚ โžขๅˆ่จˆใง Nlog2 K + 24K ใƒ“ใƒƒใƒˆ - ๅ‰ใƒšใƒผใ‚ธๅ›ณ9.3ใฎๅ…ƒ็”ปๅƒใฏ240*180ใƒ”ใ‚ฏใ‚ปใƒซใงๆง‹ๆˆใ•ใ‚ŒใฆใŠใ‚Šใ€24Nใ‚’่จˆ็ฎ—ใ™ใ‚‹ใจ 1,036,800 ใƒ“ใƒƒใƒˆ - K-meansใงๆธ›่‰ฒใ—ใŸๅ ดๅˆใ€K=2 โ†’ 43,248ใƒ“ใƒƒใƒˆ(4.2%)ใ€K=10 โ†’ 173,040ใƒ“ใƒƒใƒˆ(16.7%) โ€ข โ€ปK-meansใฎ่ชฌๆ˜ŽใฎใŸใ‚็”ปๅƒๅˆ†ๅ‰ฒใฎใƒ‡ใƒผใ‚ฟๅœง็ธฎๆฏ”ใ‚’่ชฟในใŸใŒใ€่‰ฏใ„ๅœง็ธฎๅ™จใ‚’ไฝœใ‚ŠใŸใ„ใชใ‚‰ ไพ‹ใˆใฐ5x5ใฎใƒ”ใ‚ฏใ‚ปใƒซใ‚’ใพใจใ‚ใ‚‹็ญ‰ใ€ใ‚‚ใฃใจใ„ใ„ๆ–นๆณ•ใŒใ‚ใ‚‹ใ€‚ 9/56
  8. 9.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นใƒขใƒ‡ใƒซ โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใซๅ…ฅใ‚‹ใŸใ‚ใซๆฝœๅœจๅค‰ๆ•ฐใ‚’ไฝฟใฃใŸๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใ‚’ๅฐŽๅ…ฅ - 2็ซ ใงใ€ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฏใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎ็ทšๅฝข้‡ใญๅˆใ‚ใ›ใงๆ›ธใ‘ใ‚‹ใ“ใจใ‚’่ฆ‹ใŸใ€‚ - ใ“ใ“ใซKๆฌกๅ…ƒใฎ2ๅ€ค็ขบ็އๅค‰ๆ•ฐ ๐ณ ใ‚’ๅฐŽๅ…ฅใ™ใ‚‹ใ€‚

    - Kๅ€‹ใฎ่ฆ็ด ใฎใ†ใกใ€ใฉใ‚Œใ‹ไธ€ใค ๐‘ง๐‘˜ ใ ใ‘ใŒ1ใงใ€ไป–ใฏ0ใฎๅค‰ๆ•ฐ๏ผˆ1-of-K๏ผ‰ โžข ๐ณ = (0, 0, โ€ฆ , 1, โ€ฆ , 0) - ใคใพใ‚Šใ€ ๐‘ง๐‘˜ โˆˆ {0, 1} ใ‹ใค ฯƒ๐‘˜=1 ๐พ ๐‘ง๐‘˜ = 1 - ๐ณ ใฎๅ‘จ่พบๅˆ†ๅธƒใฏๆททๅˆไฟ‚ๆ•ฐ ๐œ‹๐‘˜ ใซใ‚ˆใฃใฆๆฑบใพใ‚‹ใจใ™ใ‚‹ใ€‚ - ใŸใ ใ— ๐œ‹๐‘˜ ใฏไปฅไธ‹ใ‚’ๆบ€ใŸใ™ใ€‚ (9.8) (9.9) 11/56
  9. 9.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นใƒขใƒ‡ใƒซ โ€ข ๐ณ ใ‚’1-of-K ใง่กจใ—ใŸใฎใงใ€ ๐‘(๐ณ) ใฏ ๐œ‹๐‘˜ ใ‚’ไฝฟใฃใฆไปฅไธ‹ใฎใ‚ˆใ†ใซๆ›ธใ‘ใ‚‹ใ€‚

    โ€ข ๐ณ ใŒไธŽใˆใ‚‰ใ‚ŒใŸใจใใฎ ๐ฑ ใฎๆกไปถไป˜็ขบ็އใฏไปฅไธ‹ โ€ข ๐ณ ใซใคใ„ใฆๅ‘จ่พบๅŒ–ใ™ใ‚‹ใจ2็ซ ใงใฟใŸๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใŒๅ‡บใฆใใ‚‹๏ผˆๆผ”็ฟ’9.3๏ผ‰ใ€‚ โ€ข ใ“ใ“ใพใงใงใ€้™ฝใซๆฝœๅœจๅค‰ๆ•ฐ ๐ณ ใ‚’ๅซใ‚€ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎ่กจ็พๆ–นๆณ•ใ‚’่ฆ‹ๅ‡บใ—ใŸใฎใงใ€2็ซ ใง ๆ‰ฑใฃใŸ ๐‘(๐ฑ) ใ ใ‘ใงใชใ ๐‘(๐ฑ, ๐ณ) ใ‚’ไฝฟใฃใŸ่ญฐ่ซ–ใŒๅฏ่ƒฝใซใชใฃใŸใ€‚ (9.10) (9.11) (9.12) (๐‘ง๐‘˜ = 1 ใฎๅ ดๅˆใ—ใ‹ๆฎ‹ใ‚‰ใชใ„) 12/56
  10. 9.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นใƒขใƒ‡ใƒซ โ€ข ๐ฑ ใ‚’ไธŽใˆใ‚‰ใ‚ŒใŸ็Šถๆ…‹ใงใฎ ๐ณ ใฎๆกไปถไป˜ใ็ขบ็އ ๐›พ(๐‘ง๐‘˜ ) ใซใคใ„ใฆ่€ƒใˆใ‚‹ใ€‚

    ๐›พ ๐‘ง๐‘˜ = ๐‘ ๐‘ง๐‘˜ = 1 ๐ฑ = ๐‘ ๐ฑ, ๐‘ง๐‘˜ = 1 ๐‘ ๐ฑ = ๐‘ ๐ฑ ๐‘ง๐‘˜ = 1 ๐‘ ๐‘ง๐‘˜ = 1 ฯƒ ๐‘—=1 ๐พ ๐‘ ๐ฑ ๐‘ง๐‘— = 1 ๐‘ ๐‘ง๐‘— = 1 = ๐œ‹๐‘˜ ๐’ฉ ๐ฑ ๐๐‘˜ , ๐šบ๐‘˜ ฯƒ ๐‘—=1 ๐พ ๐œ‹๐‘— ๐’ฉ ๐ฑ|๐๐‘— , ๐šบ๐‘— - ๐œ‹๐‘˜ ใ‚’ ๐‘ง๐‘˜ = 1 ใจใชใ‚‹็พ่ฑกใฎไบ‹ๅ‰็ขบ็އใ€ ๐›พ ๐‘ง๐‘˜ ใ‚’ ๐ฑ ใ‚’่ฆณๆธฌใ—ใŸๆ™‚ใฎไบ‹ๅพŒ็ขบ็އใจใฟใชใ›ใ‚‹ใ€‚ - ๅˆ†ๆฏ๏ผš1~Kใฎๅ…จใฆใฎ่ฆ็ด ใซใคใ„ใฆใฎๆททๅˆไฟ‚ๆ•ฐร—ใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎๅ’Œ - ๅˆ†ๅญ๏ผš ๐‘˜ ็•ช็›ฎใฎๆททๅˆไฟ‚ๆ•ฐร—ใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒ - ๐›พ ๐‘ง๐‘˜ ใฏใ€ๆททๅˆ่ฆ็ด  ๐‘˜ ใŒ ๐ฑ ใฎ่ฆณๆธฌใ‚’่ชฌๆ˜Žใ™ใ‚‹ๅบฆๅˆใ„ใ‚’่กจใ™่ฒ ๆ‹…็އใจใ—ใฆ่งฃ้‡ˆใงใใ‚‹ใ€‚ (9.13) 13/56
  11. 9.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นใƒขใƒ‡ใƒซ โ€ข ๅŒๆ™‚ๅˆ†ๅธƒ ๐‘ ๐ฑ, ๐ณ = ๐‘ ๐ณ

    ๐‘(๐ฑ|๐ณ) ใ‹ใ‚‰ใฎใ‚ตใƒณใƒ—ใƒซใฏๅ›ณ(a)ใฎใ‚ˆใ†ใซ็คบใ›ใ‚‹ใ€‚ โ€ข ๅ‘จ่พบๅˆ†ๅธƒ ๐‘(๐ฑ) ใฏๅ›ณ(b) โ€ข ๅ„ใƒ‡ใƒผใ‚ฟ็‚นใฎ่ฒ ๆ‹…็އใ‚’่จˆ็ฎ—ใ—ใฆ่‰ฒใซใ‚ฐใƒฉใƒ‡ใƒผใ‚ทใƒงใƒณใ‚’ใ‹ใ‘ใŸใฎใŒๅ›ณ(c) โ€ข (a)ใฎใ‚ˆใ†ใชๅŒๆ™‚ๅˆ†ๅธƒใŒๅˆ†ใ‹ใฃใฆใ„ใ‚‹ใƒ‡ใƒผใ‚ฟ้›†ๅˆใฏๅฎŒๅ…จใ€(b)ใฎใ‚ˆใ†ใชๅ‘จ่พบๅˆ†ๅธƒใ—ใ‹ๅˆ†ใ‹ใฃ ใฆใ„ใชใ„ใƒ‡ใƒผใ‚ฟ้›†ๅˆใฏไธๅฎŒๅ…จใจๅ‘ผใฐใ‚Œใ‚‹ใ€‚ (ๅ›ณ9.5) 14/56
  12. 9.2.1 ๆœ€ๅฐคๆŽจๅฎš โ€ข ใƒ‡ใƒผใ‚ฟ้›†ๅˆ {๐ฑ1 , ๐ฑ2 , โ€ฆ ๐ฑ๐‘

    } ใซใคใ„ใฆใ€ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใ‚’ๅฝ“ใฆใฏใ‚ใ‚‹ๅ•้กŒใ‚’่€ƒใˆใ‚‹ใ€‚ - 1ใคใฎใƒ‡ใƒผใ‚ฟ็‚นใฏDๆฌกๅ…ƒใฎใƒ™ใ‚ฏใƒˆใƒซใงใ‚ใ‚Šใ€Nร—D่กŒๅˆ— X ใง่กจใ™ใ€‚ - ๆฝœๅœจๅค‰ๆ•ฐใฏ ๐ณ๐‘› T ใ‚’่กŒใƒ™ใ‚ฏใƒˆใƒซใจใ™ใ‚‹Nร—K่กŒๅˆ— Z ใง่กจใ™ใ€‚ ๐— = ๐‘ฅ11 โ‹ฏ ๐‘ฅ1๐ท โ‹ฎ โ‹ฑ โ‹ฎ ๐‘ฅ๐‘1 โ‹ฏ ๐‘ฅ๐‘๐ท ๐™ = ๐‘ง11 โ‹ฏ ๐‘ง1๐พ โ‹ฎ โ‹ฑ โ‹ฎ ๐‘ง๐‘1 โ‹ฏ ๐‘ง๐‘๐พ โ€ข ๅฏพๆ•ฐๅฐคๅบฆใ‚’่จˆ็ฎ—ใ—ใฆใ„ใใ€‚ ๐‘ ๐—|๐…, ๐, ๐šบ = เท‘ ๐‘›=1 ๐‘ ๐‘ ๐ฑ๐‘› ๐…, ๐, ๐šบ = เท‘ ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ|๐๐‘˜ , ๐šบ๐‘˜ ln๐‘ ๐—|๐…, ๐, ๐šบ = ln เท‘ ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ|๐๐‘˜ , ๐šบ๐‘˜ = เท ๐‘›=1 ๐‘ ln เท ๐‘˜=1 ๐พ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ|๐๐‘˜ , ๐šบ๐‘˜ (9.12) (9.14) 15/56
  13. 9.2.1 ๆœ€ๅฐคๆŽจๅฎš โ€ข ๅ‰ใƒšใƒผใ‚ธใงๆฑ‚ใ‚ใŸๅฏพๆ•ฐๅฐคๅบฆใฎๆœ€ๅคงๅŒ–ใฏใ€็‰น็•ฐๆ€งใฎๅญ˜ๅœจใซ่ตทๅ› ใ™ใ‚‹้‡่ฆใชๅ•้กŒใŒใ‚ใ‚‹ใ€‚ - ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใงใฏๅ˜็ด”ใชๆœ€ๅฐคๆŽจๅฎšใŒไฝฟใˆใชใ„ใจใ„ใ†่ฉฑ โ€ข ๅ˜็ด”ๅŒ–ใฎใŸใ‚ใ€ๅ„ๆททๅˆ่ฆ็ด ใฎๅ…ฑๅˆ†ๆ•ฃ่กŒๅˆ—ใŒ ๐œŽ๐‘˜ 2๐ˆ

    ใฎ็ญ‰ๆ–นใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใ ใจใ™ใ‚‹ใ€‚ - ๆททๅˆใƒขใƒ‡ใƒซใฎ ๐‘— ็•ช็›ฎใฎๅนณๅ‡ ๐๐‘— ใŒใ€ใƒ‡ใƒผใ‚ฟ้›†ๅˆ {๐ฑ1 , ๐ฑ2 , โ€ฆ ๐ฑ๐‘ } ใฎใ†ใก1็‚นใจ็ญ‰ใ—ใ„ใจใ™ใ‚‹ใ€‚ โžข ใ™ใชใ‚ใกใ€ ๐๐‘— = ๐ฑ๐‘› ใจใชใ‚‹ ๐ฑ๐‘› ใŒๅญ˜ๅœจใ™ใ‚‹ใ‚ฑใƒผใ‚นใซใคใ„ใฆ่€ƒใˆใ‚‹ใ€‚ - ใ“ใฎใƒ‡ใƒผใ‚ฟ็‚นใฏใ€ๅฐคๅบฆ้–ขๆ•ฐใซๅฏพใ—ใฆๆฌกๅผใฎๅฝขใงๅฏ„ไธŽใ™ใ‚‹ใ€‚ (2.43) (9.15) - ใ“ใฎๅผใ‹ใ‚‰ใ€๐œŽ๐‘— โ†’ 0 ใฎใจใใซๅฏพๆ•ฐๅฐคๅบฆใŒ็„ก้™ๅคงใซ็™บๆ•ฃใ™ใ‚‹ใ“ใจใŒๅˆ†ใ‹ใ‚‹ใ€‚ โžข ๐๐‘— = ๐ฑ๐‘› ใจใชใ‚‹ ๐ฑ๐‘› ใŒๅญ˜ๅœจใ™ใ‚‹ๅ ดๅˆใฏ ๐๐‘— ใ‚„ ๐œŽ๐‘— ใฎๅพฎๅˆ†ใ‚’ใ‚’ใ—ใฆใ‚‚้™ฝใช่งฃใŒๅพ—ใ‚‰ใ‚Œใชใ„ ใจใ„ใ†ใ“ใจใซใชใ‚‹ใ€‚ - ใ“ใฎใŸใ‚ใ€ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎๅฝขใ‚’ๆฑบใ‚ใ‚‹้š›ใ€ๅฏพๆ•ฐๅฐคๅบฆใฎๆœ€ๅคงๅŒ–ใฏไธ่‰ฏ่จญๅฎšๅ•้กŒใงใ‚ใ‚‹ใ€‚ โžข ใƒ™ใ‚คใ‚ธใ‚ขใƒณใ‚ขใƒ—ใƒญใƒผใƒ (ยง10.1) ใงใ“ใ‚Œใ‚’่งฃๆฑบใงใใ‚‹ใ€‚ 16/56
  14. 9.2.1 ๆœ€ๅฐคๆŽจๅฎš โ€ข ๏ผ‘ใคใฎๆททๅˆ่ฆ็ด ใงใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎๅˆ†ๆ•ฃใŒ 0 ใซ่ฟ‘ใฅใ„ใฆใ„ใ‚‹ๅ›ณ โ€ข ใ‚‚ใ†ไธ€ใคใ€Kๅ€‹ใฎๆททๅˆ่ฆ็ด ใฎๅ…ฅใ‚Œๆ›ฟใˆใซๅฏพใ—ใฆใ€ๅŒ็ญ‰ใช่งฃใŒ K! ๅ€‹ใ‚ใ‚‹ใจใ„ใ†ๅ•้กŒใŒใ‚ใ‚‹ใ€‚

    ln๐‘ ๐—|๐…, ๐, ๐šบ = เท ๐‘›=1 ๐‘ ln เท ๐‘˜=1 ๐พ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ|๐๐‘˜ , ๐šบ๐‘˜ - ใ“ใฎๅ•้กŒใฏใ€ใ€Œ่ญ˜ๅˆฅๅฏ่ƒฝๆ€งใฎๅ•้กŒใ€ใจใ—ใฆ็Ÿฅใ‚‰ใ‚Œใฆใ„ใ‚‹ใ€‚ - ใ—ใ‹ใ—ใ€่‰ฏใ„ๅฏ†ๅบฆใƒขใƒ‡ใƒซใจใ—ใฆใฎๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใ‚’่ฆ‹ใคใ‘ใ‚‹ใจใ„ใ†็›ฎ็š„ใซใฏ้–ขไฟ‚ใชใ„ใ€‚ โžข ๏ผˆ็ญ‰ไพกใช่งฃใงใ‚‚่‰ฏใ„ใƒขใƒ‡ใƒซใงใ‚ใ‚Œใฐๅ•้กŒใซใชใ‚‰ใชใ„๏ผ‰ (9.14) (ๅ›ณ9.7) 17/56
  15. 9.2.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎๅฐŽๅ…ฅ โ€ข ใพใšๅฐคๅบฆ้–ขๆ•ฐใŒๆœ€ๅคง็‚นใซใŠใ„ใฆๆบ€ใŸใ™ในใๆกไปถใ‚’ๆ›ธใไธ‹ใ™ใ€‚ - ๅฐคๅบฆ้–ขๆ•ฐใ‚’ๅนณๅ‡ใƒ™ใ‚ฏใƒˆใƒซ ๐๐‘˜ ใงๅพฎๅˆ†ใ—ใฆ

    0 ใจใŠใ๏ผˆ้€”ไธญๅผใฏๆฌกใƒšใƒผใ‚ธ๏ผ‰ใ€‚ ๐œ• ๐œ•๐๐‘˜ ln๐‘ ๐— ๐œ‹, ๐๐‘˜ , ๐šบ๐‘˜ = เท ๐‘›=1 ๐‘ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ ฯƒ ๐‘— ๐œ‹๐‘— ๐’ฉ ๐ฑ๐‘› ๐๐‘— , ๐šบ๐‘— ๐šบ๐‘˜ โˆ’1 ๐ฑ๐‘› โˆ’ ๐๐‘˜ = 0 - ๅทฆใ‹ใ‚‰ฮฃ๐‘˜ ใ‚’ใ‹ใ‘ใฆๆ•ด็†ใ™ใ‚‹ใจไปฅไธ‹ใฎใ‚ˆใ†ใซใชใ‚‹ใ€‚ เท ๐‘›=1 ๐‘ ๐›พ(๐‘ง๐‘›๐‘˜ ) ๐ฑ๐‘› โˆ’ ๐๐‘˜ เท ๐‘›=1 ๐‘ ๐›พ ๐‘ง๐‘›๐‘˜ = 0 ๐๐‘˜ = 1 ๐‘๐‘˜ เท ๐‘›=1 ๐‘ ๐›พ(๐‘ง๐‘›๐‘˜ ) ๐ฑ๐‘› , ๐‘คโ„Ž๐‘’๐‘Ÿ๐‘’ ๐‘๐‘˜ = เท ๐‘›=1 ๐‘ ๐›พ(๐‘ง๐‘›๐‘˜ ) - ๐‘๐‘˜ ใฏใ‚ฏใƒฉใ‚นใ‚ฟ k ใซๅฑžใ™ใ‚‹ๅฎŸๅŠน็š„ใชใƒ‡ใƒผใ‚ฟ็‚นใฎๆ•ฐใซใชใฃใฆใ„ใ‚‹ใ€‚ - ๅนณๅ‡ใƒ™ใ‚ฏใƒˆใƒซ ๐๐‘˜ ใฏ่ฒ ๆ‹…็އร—ใƒ‡ใƒผใ‚ฟ็‚นใฎๅ’Œใ‚’ๅฎŸ่กŒ็š„ใชใƒ‡ใƒผใ‚ฟๆ•ฐใงๅ‰ฒใฃใŸๅฝขใซใชใฃใฆใ„ใ‚‹ใ€‚ || ๐›พ(๐‘ง๐‘›๐‘˜ ) (9.17) (9.18) 18/56
  16. 9.2.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข ๅฐคๅบฆ้–ขๆ•ฐใ‚’ ๐šบ๐‘˜ ใงๅพฎๅˆ† โ€ข ๐œ‹๐‘˜ ใงๅพฎๅˆ† -

    ๐œ‹๐‘˜ ใฏๆททๅˆไฟ‚ๆ•ฐใงใ‚ใ‚Šใ€ๅ’ŒใŒ 1 ใซใชใ‚‹ใจใ„ใ†ๅˆถ็ด„ใŒใ‚ใ‚‹ใฎใงใƒฉใ‚ฐใƒฉใƒณใ‚ธใƒฅ - ไธก่พบใซ ๐œ‹๐‘˜ ใ‚’ใ‹ใ‘ใฆ k ใซใคใ„ใฆๅ’Œใ‚’ใจใ‚‹ใ€‚ เท ๐‘˜=1 ๐พ เท ๐‘›=1 ๐‘ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ ฯƒ ๐‘— ๐œ‹๐‘— ๐’ฉ ๐ฑ๐‘› ๐๐‘— , ๐šบ๐‘— + เท ๐‘˜=1 ๐พ ๐œ‹๐‘˜ ๐œ† = 0 ๐œ† = โˆ’ เท ๐‘˜=1 ๐พ เท ๐‘›=1 ๐‘ ๐›พ ๐‘ง๐‘›๐‘˜ = โˆ’ เท ๐‘˜=1 ๐พ ๐‘๐‘˜ = โˆ’๐‘ (9.19) (9.20) (9.21) = ๐›พ(๐‘ง๐‘›๐‘˜ ) ๐‘๐‘˜ = เท ๐‘›=1 ๐‘ ๐›พ(๐‘ง๐‘›๐‘˜ ) 20/56
  17. 9.2.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข ๅผๅค‰ๅฝขใฎ็ถšใ - (9.21)ใฎไธก่พบใซ ๐œ‹๐‘˜ ใ‚’ใ‹ใ‘ใฆใ€ๅ‰ใƒšใƒผใ‚ธใฎ ๐œ† =

    โˆ’๐‘ ใง ๐œ† ใ‚’ๆถˆๅŽป เท ๐‘›=1 ๐‘ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ ฯƒ ๐‘— ๐œ‹๐‘— ๐’ฉ ๐ฑ๐‘› ๐๐‘— , ๐šบ๐‘— + ๐œ‹๐‘˜ ๐œ† = 0 ๐‘๐‘˜ + ๐œ‹๐‘˜ โˆ’๐‘ = 0 ๐œ‹๐‘˜ = ๐‘๐‘˜ ๐‘ - k ็•ช็›ฎใฎ่ฆ็ด ใซ้–ขใ™ใ‚‹ๆททๅˆไฟ‚ๆ•ฐใฏใ€ใใฎ่ฆ็ด ใฎๅ…จใƒ‡ใƒผใ‚ฟ็‚นใซๅฏพใ™ใ‚‹่ฒ ๆ‹…็އใฎๅนณๅ‡ใงไธŽใˆใ‚‰ใ‚Œใ‚‹ใ€‚ 21/56
  18. 9.2.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข ใ“ใ“ใพใงใง ๐๐‘˜, ๐šบ๐‘˜ , ๐œ‹๐‘˜ ใซใคใ„ใฆๆ›ธใไธ‹ใ—ใฆใใŸใŒใ€ๅ…จใฆ่ฒ ๆ‹…็އใ‚’ๅซใ‚“ใงใŠใ‚Šใ€ๆททๅˆใƒขใƒ‡ใƒซใฎใƒ‘ใƒฉใƒกใƒผ ใ‚ฟใซใคใ„ใฆ้™ฝใช่งฃใŒๅพ—ใ‚‰ใ‚ŒใŸใ‚ใ‘ใงใฏใชใ„ใ€‚

    ๐๐‘˜ = 1 ๐‘๐‘˜ เท ๐‘›=1 ๐‘ ๐›พ(๐‘ง๐‘›๐‘˜ ) ๐ฑ๐‘› ๐šบ๐‘˜ = 1 ๐‘๐‘˜ เท ๐‘› ๐‘ ๐›พ ๐‘ง๐‘›๐‘˜ ๐ฑ๐‘› โˆ’ ๐๐‘˜ ๐ฑ๐‘› โˆ’ ๐๐‘˜ T ๐œ‹๐‘˜ = ๐‘๐‘˜ ๐‘ = ฯƒ๐‘›=1 ๐‘ ๐›พ ๐‘ง๐‘›๐‘˜ ๐‘ โ€ข ใ—ใ‹ใ—ใ€ใ“ใฎ๏ผ“ใคใฎๅผใฏๆœ€ๅฐคๆŽจๅฎš่งฃใ‚’ๅพ—ใ‚‹ใŸใ‚ใฎๆ›ดๆ–ฐๅผใฎๅญ˜ๅœจใ‚’็คบๅ”†ใ—ใฆใ„ใ‚‹ใ€‚ 1. Eใ‚นใƒ†ใƒƒใƒ— (expectation step)๏ผš่ฒ ๆ‹…็އ ๐›พ(๐‘ง๐‘›๐‘˜ ) ใฎ่จˆ็ฎ— ๐›พ(๐‘ง๐‘›๐‘˜ ) = ๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ ฯƒ ๐‘— ๐œ‹๐‘— ๐’ฉ ๐ฑ๐‘› ๐๐‘— , ๐šบ๐‘— 2. Mใ‚นใƒ†ใƒƒใƒ— (maximization step)๏ผšๆททๅˆใƒขใƒ‡ใƒซใฎใƒ‘ใƒฉใƒกใƒผใ‚ฟ ๐œ‡๐‘˜ , ฮฃ๐‘˜ , ๐œ‹๐‘˜ ใฎ่จˆ็ฎ— Eใ‚นใƒ†ใƒƒใƒ—ใงๅพ—ใ‚‰ใ‚ŒใŸ ๐›พ(๐‘ง๐‘›๐‘˜ ) ใ‚’ไฝฟใฃใฆ (9.17), (9.22) ใ‚’ๆ›ดๆ–ฐ โ†’ (9.17)ใง่จˆ็ฎ—ใ—ใŸๆ–ฐใ—ใ„ๅนณๅ‡ใ‚’ไฝฟใฃใฆ(9.19)ใฎๅ…ฑๅˆ†ๆ•ฃ่กŒๅˆ—ใ‚’ๆ›ดๆ–ฐใ™ใ‚‹ใ€‚ - ใ“ใฎๆ›ดๆ–ฐใŒๅธธใซๅฐคๅบฆ้–ขๆ•ฐใ‚’ๅข—ๅŠ ใ•ใ›ใ‚‹ใ“ใจใฏ9.4็ฏ€ใง็คบใ™ใ€‚ (9.22) (9.19) (9.17) 22/56
  19. 9.2.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข K-means ใงไฝฟใฃใŸใฎใจๅŒใ˜ใƒ‡ใƒผใ‚ฟใ‚’EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใงใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐ โ€ข K=2ใฎๆททๅˆใ‚ฌใ‚ฆใ‚นใƒขใƒ‡ใƒซใซใคใ„ใฆใ€K-meansใฎๆ™‚ใจๅŒใ˜็‚นใซๅนณๅ‡ใƒ™ใ‚ฏใƒˆใƒซใ‚’่ตทใใ€ๅ…ฑๅˆ†ๆ•ฃ่กŒๅˆ—ใฏๅ˜ไฝ ่กŒๅˆ—ใฎๅ€ๆ•ฐใ‚’็”จใ„ใฆใ„ใ‚‹ใ€‚ (ๅ›ณ9.8) โ€ข

    (a) - ๅˆๆœŸๅŒ–ใ—ใŸๆง˜ๅญใ€‚ใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎๆจ™ ๆบ–ๅๅทฎใฎ็ญ‰้ซ˜็ทšใ‚’็คบใ—ใฆใ„ใ‚‹ใ€‚ โ€ข (b) - ่ฒ ๆ‹…็އใฎ่จˆ็ฎ— โ€ข (c) - ๆททๅˆใƒขใƒ‡ใƒซใฎใƒ‘ใƒฉใƒกใƒผใ‚ฟใ‚’ๆ›ดๆ–ฐ โ€ข ๅฎŸ็”จไธŠใฏใ€ๆททๅˆใƒขใƒ‡ใƒซใฎใƒ‘ใƒฉใƒกใƒผใ‚ฟใ‚’ ๆ›ดๆ–ฐใ—ใŸๅพŒใซๅฏพๆ•ฐๅฐคๅบฆ้–ขๆ•ฐใ‚’่จˆ็ฎ—ใ—ใ€ ๅข—ๅŠ ้‡ใŒๆ‰€ๅฎšใฎๅ€คใ‚ˆใ‚Šใ‚‚ๅฐใ•ใใชใฃใŸ ๆ™‚ใซๅŽๆŸใ—ใŸใจๅˆคๆ–ญใ™ใ‚‹ใ€‚ 23/56
  20. 9.3 EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎใ‚‚ใ†ไธ€ใคใฎ่งฃ้‡ˆ โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎ็›ฎ็š„ใฏใ€ๆฝœๅœจๅค‰ๆ•ฐใ‚’ๅซใ‚€ใƒขใƒ‡ใƒซใซใŠใ„ใฆๆœ€ๅฐค่งฃใ‚’่ฆ‹ใคใ‘ๅ‡บใ™ใ“ใจใ€‚ - ๅ…จใฆใฎใƒขใƒ‡ใƒซใƒ‘ใƒฉใƒกใƒผใ‚ฟใฎ้›†ๅˆใ‚’ ๐œฝ ใง่กจใ™ใจใ€ไปฅไธ‹ใฎใ‚ˆใ†ใซๆ›ธใ‘ใ‚‹ใ€‚ ๐— =

    ๐‘ฅ11 โ‹ฏ ๐‘ฅ1๐ท โ‹ฎ โ‹ฑ โ‹ฎ ๐‘ฅ๐‘1 โ‹ฏ ๐‘ฅ๐‘๐ท ๐™ = ๐‘ง11 โ‹ฏ ๐‘ง1๐พ โ‹ฎ โ‹ฑ โ‹ฎ ๐‘ง๐‘1 โ‹ฏ ๐‘ง๐‘๐พ - ๐‘(๐—, ๐™|๐œฝ) ใŒๆŒ‡ๆ•ฐๅž‹ๅˆ†ๅธƒๆ—ใงใ‚ใฃใŸใจใ—ใฆใ‚‚ใ€Zใซใคใ„ใฆๅ’Œใ‚’ใจใ‚‹ใจๅ‘จ่พบๅˆ†ๅธƒ ๐‘(๐—|๐œฝ) ๆŒ‡ๆ•ฐๅž‹ๅˆ†ๅธƒๆ— ใงใฏใชใใชใ‚Šใ€ๆœ€ๅฐค่งฃใฏ็ตๆžœใจใ—ใฆ่ค‡้›‘ใชๅฝขใซใชใฃใฆใ—ใพใ†ใ€‚ โžข ๏ผˆ่งฃๆž็š„ใช่งฃใ‚’ๅพ—ใ‚‹ใ“ใจใŒ้›ฃใ—ใ„ใฎใงEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใŒๅฝน็ซ‹ใคใจใ„ใ†ใ“ใจใŒ่จ€ใ„ใŸใ„๏ผŸ๏ผ‰ (9.29) โ€ข ใƒ‡ใƒผใ‚ฟ้›†ๅˆ {๐—, ๐™} ใ‚’ๅฎŒๅ…จใƒ‡ใƒผใ‚ฟ้›†ๅˆใจๅ‘ผใณใ€ๅฎŸ้š›ใฎ่ฆณๆธฌใƒ‡ใƒผใ‚ฟ ๐— ใฏไธๅฎŒๅ…จใจๅ‘ผใถใ€‚ - ๆœฌๆฅใชใ‚‰ln๐‘(๐—, ๐™|๐œฝ)๏ผˆๅฎŒๅ…จใƒ‡ใƒผใ‚ฟๅฏพๆ•ฐๅฐคๅบฆ้–ขๆ•ฐ๏ผ‰ใ‚’ๆฑ‚ใ‚ใŸใ„ใŒใ€ๅฎŸ้š›ใซใฏ Z ใฏไธŽใˆใ‚‰ใ‚Œใชใ„ใ€‚ - ใใ“ใงใ€ไบ‹ๅพŒ็ขบ็އ ๐‘(๐™|๐—, ๐œฝ) ใ‚’ไฝฟใฃใฆ ln๐‘(๐—, ๐™|๐œฝ) ใฎๆœŸๅพ…ๅ€คใ‚’ๆœ€ๅคงๅŒ–ใ™ใ‚‹ใ“ใจใ‚’่€ƒใˆใ‚‹ใ€‚ - ไบ‹ๅพŒ็ขบ็އใฎ่จˆ็ฎ—ใซใฏๆ›ดๆ–ฐๅ‰ใฎ ๐œฝ๐‘œ๐‘™๐‘‘ ใ‚’ไฝฟใ„ใ€ๆœŸๅพ…ๅ€คใ‚’ๆœ€ๅคงๅŒ–ใ™ใ‚‹๐œฝ๐‘›๐‘’๐‘ค ใ‚’ๆฑ‚ใ‚ใ‚‹ใ€‚ โžข ใ“ใฎๆœŸๅพ…ๅ€คใ‚’ ๐’ฌ(๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘) ใจ่กจ่จ˜ใ™ใ‚‹ใ€‚ใ“ใฎๆœŸๅพ…ๅ€คใ‚’่จˆ็ฎ—ใ™ใ‚‹ใ€‚ ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ = ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘ ๐—, ๐™ ๐œฝ = เท ๐™ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘(๐—, ๐™|๐œฝ) (9.30) 26/56
  21. 9.3 EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎใ‚‚ใ†ไธ€ใคใฎ่งฃ้‡ˆ โ€ข ๆฌกใซใ€ๆœŸๅพ…ๅ€ค ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ ใ‚’ๆœ€ๅคงๅŒ–ใ™ใ‚‹๐œฝ๐‘›๐‘’๐‘ค ใ‚’่จˆ็ฎ—ใ™ใ‚‹ใ€‚ -

    ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ ใฎ่จˆ็ฎ—ใซใŠใ„ใฆใ€ๅฏพๆ•ฐใฏๅŒๆ™‚ๅˆ†ๅธƒใซๅฏพใ—ใฆ็›ดๆŽฅไฝœ็”จใ—ใฆใ„ใ‚‹ใŸใ‚ใ€่จˆ็ฎ—ใฏๅฎนๆ˜“ใ€‚ โžข ๅฏพๆ•ฐๅ‘จ่พบๅฐคๅบฆ้–ขๆ•ฐ โžข ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ = ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘ ๐—, ๐™ ๐œฝ = เท ๐™ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘(๐—, ๐™|๐œฝ) (9.32) 27/56
  22. 9.3 EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎใ‚‚ใ†ไธ€ใคใฎ่งฃ้‡ˆ โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฏMAPๆŽจๅฎšใซใ‚‚ไฝฟใˆใ‚‹ใ€‚ - ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ ใฏไปฅไธ‹ใฎใ‚ˆใ†ใชๅผใงใ‚ใฃใŸใŒใ€ ๐’ฌ

    ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ = เท ๐™ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘(๐—, ๐™|๐œฝ) - ใ“ใ“ใซ ๐œฝ ใฎไบ‹ๅ‰ๅˆ†ๅธƒใ‚’ๅฐŽๅ…ฅใ—ใ€ ๐’ฌ๐‘€๐ด๐‘ƒ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ = เท ๐™ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ ๐œฝ = เท ๐™ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘ ๐—, ๐™ ๐œฝ + เท ๐™ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘ ๐œฝ = ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ + ln๐‘ ๐œฝ - ไบ‹ๅ‰ๅˆ†ๅธƒใ‚’้ฉๅˆ‡ใซ้ธใถใ“ใจใŒใงใใ‚‹ใฎใงใ‚ใ‚Œใฐใ€ๅ›ณ9.7ใง็คบใ—ใŸใ‚ˆใ†ใชใ€ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใง๏ผ‘ใคไปฅ ไธŠใฎ่ฆ็ด ใฎๅˆ†ๆ•ฃใŒ 0 ใซ่ฟ‘ใฅใใ“ใจใงๅฐคๅบฆ้–ขๆ•ฐใŒ็™บๆ•ฃใ™ใ‚‹ๅ•้กŒใ‚’ๅ›ž้ฟใ™ใ‚‹ใ“ใจใŒใงใใ‚‹ใ€‚ (ๅ›ณ9.7ๅ†ๆŽฒ) 29/56
  23. 9.3.1 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒๅ†่จช โ€ข ไธๅฎŒๅ…จใƒ‡ใƒผใ‚ฟใฎๅฏพๆ•ฐๅฐคๅบฆ้–ขๆ•ฐ ln๐‘(๐—|๐, ๐šบ, ๐…) ใฎใจใใฏๅฏพๆ•ฐใฎไธญใซใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎๅ’ŒใŒๅ…ฅใฃใฆใ„ใŸใฎใง่ค‡้›‘ ใซใชใฃใฆใŠใ‚Šใ€่งฃใ‚’ๅพ—ใ‚‹ใ“ใจใŒ้›ฃใ—ใ‹ใฃใŸใ€‚ โ€ข

    ๆฝœๅœจๅค‰ๆ•ฐใ‚’ๅฐŽๅ…ฅใ—ใ€ๅฎŒๅ…จใƒ‡ใƒผใ‚ฟใฎๅฏพๆ•ฐๅฐคๅบฆ้–ขๆ•ฐใงใฏใ“ใฎใ‚ˆใ†ใชๅ•้กŒใฏ่ตทใใšใ€ใ‚ˆใ‚Š็ฐกไพฟใซๅ–ใ‚Šๆ‰ฑใˆใ‚‹ ใ‚ˆใ†ใซใชใฃใŸใ€‚ - ๅฏพๆ•ฐใŒ็›ดๆŽฅใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใซไฝœ็”จใ™ใ‚‹ใฎใงใ€่งฃๆž็š„ใซ่งฃใ‘ใ‚‹ใ€‚ โžข ๐๐’Œ , ๐šบ๐’Œ ใซใคใ„ใฆใฏ๏ผ’็ซ ใฎๅ˜ไธ€ใฎใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใจๅŒใ˜ใ€‚ โžข ๐œ‹๐‘˜ ใฏไปฅไธ‹ (9.36) (9.14) (9.37) 31/56
  24. 9.3.1 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒๅ†่จช โ€ข ฯƒ๐‘˜=1 ๐พ ๐œ‹๐‘˜ = 1 ใฎๅˆถ็ด„ใ‚’่€ƒใˆใฆใ€ใƒฉใ‚ฐใƒฉใƒณใ‚ธใƒฅใง่งฃใใ€‚ โ„’

    = เท ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐‘ง๐‘›๐‘˜ {ln๐œ‹๐‘˜ + ln๐’ฉ(๐ฑ๐‘› |๐๐‘˜ , ๐šบ๐‘˜ )} โˆ’ ๐œ† เท ๐‘˜=1 ๐พ ๐œ‹๐‘˜ โˆ’ 1 ๐œ• ๐œ•๐œ‹๐‘˜ โ„’ = ฯƒ๐‘›=1 ๐‘ ๐‘ง๐‘›๐‘˜ ๐œ‹๐‘˜ โˆ’ ๐œ† = 0 (1) - (1) ใฎไธก่พบใซ ๐œ‹๐‘˜ ใ‚’ใ‹ใ‘ใฆ ๐‘˜ ใงๅ’Œใ‚’ใจใ‚‹ใ€‚ เท ๐‘˜=1 ๐พ เท ๐‘›=1 ๐‘ ๐‘ง๐‘›๐‘˜ โˆ’ ๐œ† = 0 ๐œ† = ๐‘ โˆต เท ๐‘˜=1 ๐พ ๐‘ง๐‘›๐‘˜ = 1 - (1) ใ‹ใ‚‰ ๐œ† ใ‚’ๆถˆๅŽป ๐œ‹๐‘˜ = ฯƒ๐‘›=1 ๐‘ ๐‘ง๐‘›๐‘˜ ๐œ† = 1 ๐‘ เท ๐‘›=1 ๐‘ ๐‘ง๐‘›๐‘˜ 32/56
  25. 9.3.1 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒๅ†่จช โ€ข ๅฎŸ้š›ใซใฏ Z ใฏไธŽใˆใ‚‰ใ‚Œใชใ„ใฎใงใ€๐‘(๐™|๐—, ๐œฝ๐‘œ๐‘™๐‘‘) ใ‚’ไฝฟใฃใฆ ln๐‘ ๐—,

    ๐™ ๐œฝ ใฎๆœŸๅพ…ๅ€คใ‚’ๆฑ‚ใ‚ใ‚‹ใฎใงใ‚ใฃใŸใ€‚ - ln๐‘ ๐—, ๐™ ๐œฝ ใฎไธญใงใ€่ฆณๆธฌใงใใชใ„ ๐‘ง๐‘›๐‘˜ ใซใคใ„ใฆๆœŸๅพ…ๅ€คใ‚’ใจใ‚‹ใ€‚ ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘ ๐—, ๐™ ๐œฝ = ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ เท ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐‘ง๐‘›๐‘˜ ln๐œ‹๐‘˜ + ln๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ = เท ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ [๐‘ง๐‘›๐‘˜ ] ln๐œ‹๐‘˜ + ln๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ - ใ‚ใ‚‹ใƒ‡ใƒผใ‚ฟ็‚น n ใซใคใ„ใฆใ€ ๐‘(๐ณ๐‘› |๐ฑ๐‘› , ๐๐‘˜ , ๐šบ๐‘˜ ) ใฎไบ‹ๅพŒๅˆ†ๅธƒใซ้–ขใ™ใ‚‹ๆŒ‡็คบๅค‰ๆ•ฐ ๐ณ๐‘› ใฎๆœŸๅพ…ๅ€คใ‚’ๆฑ‚ใ‚ใŸใ„ใ€‚ โžข ใพใšใฏใƒ™ใ‚คใ‚บใฎๅฎš็†ใง ๐‘(๐ณ๐‘› |๐ฑ๐‘› , ๐๐‘˜ , ๐šบ๐‘˜ ) ใฎ่จˆ็ฎ— ๐‘(๐ณ๐‘› ๐ฑ๐‘› , ๐๐‘˜ , ๐šบ๐‘˜ = ๐‘ ๐ฑ๐‘› , ๐ณ๐‘› ๐‘ ๐ฑ๐‘› = ๐‘ ๐ฑ๐‘› ๐ณ๐‘› ๐‘ ๐ณ๐‘› ฯƒ๐ณ๐‘› ๐‘ ๐ฑ๐‘› ๐ณ๐‘› ๐‘ ๐ณ๐‘› = ฯ‚ ๐‘˜โ€ฒ=1 ๐พ ๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜โ€ฒ , ๐šบ๐‘˜โ€ฒ ๐‘ง ๐‘›๐‘˜โ€ฒ ฯƒ๐ณ๐‘› ฯ‚ ๐‘˜=1 ๐พ [๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ ]๐‘ง๐‘›๐‘˜ 33/56
  26. 9.3.1 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒๅ†่จช โ€ข ๐ณ๐‘› ใฎๆœŸๅพ…ๅ€คใ‚’่จˆ็ฎ— ๐‘(๐ณ๐‘› ๐ฑ๐‘› , ๐๐‘˜ ,

    ๐šบ๐‘˜ = ฯ‚ ๐‘˜โ€ฒ=1 ๐พ ๐œ‹๐‘˜โ€ฒ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜โ€ฒ , ๐šบ๐‘˜โ€ฒ ๐‘ง ๐‘›๐‘˜โ€ฒ ฯƒ๐ณ๐’ [๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ ]๐‘ง๐‘›๐‘˜ โ€ฆ โ€ฆ ๐ณ๐‘› = ๐‘ง๐‘›1 , ๐‘ง๐‘›2 , โ€ฆ ๐‘ง๐‘›๐‘˜ , โ€ฆ ๐‘ง๐‘›๐พ ๐‘ ๐‘ง๐‘›๐‘˜ = เท‘ ๐‘˜=1 ๐พ ๐œ‹ ๐‘˜ ๐‘ง๐‘›๐‘˜ ฮฃ๐ณ๐‘› ใฏใ€่€ƒใˆๅพ—ใ‚‹ ๐ณ๐’ ใ™ในใฆใซใคใ„ใฆใฎ ๅ’Œใ‚’่กจใ—ใฆใ„ใ‚‹ใ€‚ ๐‘ง๐‘›1 = 1 1,0, โ€ฆ 0, โ€ฆ 0 ๐‘ง๐‘›2 = 1 0,1, โ€ฆ 0, โ€ฆ 0 ๐‘ง๐‘›๐‘˜ = 1 0,0, โ€ฆ 1, โ€ฆ 0 ๐‘ง๐‘›๐พ = 1 (0,0, โ€ฆ 0, โ€ฆ 1) K (9.40) ๐”ผ๐ณ๐‘›|๐ฑ๐‘›,๐๐‘˜,๐šบ๐‘˜ ๐‘ง๐‘›๐‘˜ = เท ๐ณ๐‘› ๐‘ง๐‘›๐‘˜ ๐‘(๐ณ๐‘› ๐ฑ๐‘› , ๐๐‘˜ , ๐šบ๐‘˜ = ฯƒ๐ณ๐‘› ๐‘ง๐‘›๐‘˜ ฯ‚ ๐‘˜โ€ฒ=1 ๐พ ๐œ‹๐‘˜โ€ฒ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜โ€ฒ , ๐šบ๐‘˜โ€ฒ ๐‘ง ๐‘›๐‘˜โ€ฒ ฯƒ๐ณ๐’ ฯ‚ ๐‘—=1 ๐พ [๐œ‹๐‘— ๐’ฉ ๐ฑ๐‘› ๐๐‘— , ๐šบ๐‘— ]๐‘ง๐‘›๐‘— = 0 ร— ๐œ‹1 ๐’ฉ ๐ฑ๐‘› ๐1 , ๐šบ1 + โ‹ฏ + 1 ร— ๐œ‹๐‘˜ ๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ + โ‹ฏ 0 ร— ๐œ‹๐พ ๐’ฉ ๐ฑ๐‘› ๐๐พ , ๐šบ๐พ ๐œ‹1 ๐’ฉ ๐ฑ๐‘› ๐1 , ๐šบ1 + โ‹ฏ + ๐œ‹๐พ ๐’ฉ ๐ฑ๐‘› ๐๐พ , ๐šบ๐พ โ‰ก ๐›พ ๐‘ง๐‘›๐‘˜ 34/56
  27. 9.3.1 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒๅ†่จช โ€ข ๐ณ๐‘› ใฎๆœŸๅพ…ๅ€คใ‚’่จˆ็ฎ—ใ™ใ‚‹ใจ่ฒ ๆ‹…็އใใฎใ‚‚ใฎใซใชใ‚‹ใฎใงใ€ๅŒๆ™‚ๅˆ†ๅธƒใฏไปฅไธ‹ใง่กจใ•ใ‚Œใ‚‹ใ€‚ ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘ ๐—, ๐™

    ๐œฝ = ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ เท ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐‘ง๐‘›๐‘˜ ln๐œ‹๐‘˜ + ln๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ = เท ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐”ผ ๐™|๐—,๐œฝ๐‘œ๐‘™๐‘‘ [๐‘ง๐‘›๐‘˜ ] ln๐œ‹๐‘˜ + ln๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ = เท ๐‘›=1 ๐‘ เท ๐‘˜=1 ๐พ ๐›พ ๐‘ง๐‘›๐‘˜ ln๐œ‹๐‘˜ + ln๐’ฉ ๐ฑ๐‘› ๐๐‘˜ , ๐šบ๐‘˜ โ€ข ไปฅไธŠใฎ็ตๆžœใ‹ใ‚‰ใ€ไธ€่ˆฌ็š„ใชEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใจๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎ้–ขไฟ‚ใ‚’่€ƒๅฏŸใ—ใชใŒใ‚‰ๅฏพๆ•ฐๅฐคๅบฆใฎๅผใ‚’ ๅฐŽๅ‡บใงใใŸใ€‚ 35/56
  28. 9.3.2 K-means ใจใฎ้–ข้€ฃ โ€ข K-means ใจๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใ‚’ๆฏ”่ผƒใ™ใ‚‹ใจใ€ๅผทใ„้กžไผผๆ€งใŒใ‚ใ‚‹ใ“ใจใŒๆ˜Žใ‚‰ใ‹ใซใชใ‚‹ใ€‚ - K-means ใฏใ€ๅ„ใƒ‡ใƒผใ‚ฟ็‚นใซๅฏพใ—ใฆใ‚ฏใƒฉใ‚นใ‚ฟใ‚’ใƒใƒผใƒ‰ใซๅ‰ฒใ‚Šๅฝ“ใฆใ‚‹ -

    EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฏใ€ไบ‹ๅพŒ็ขบ็އ ๐‘(๐™|๐—) ใซๅŸบใฅใ„ใฆใ‚ฏใƒฉใ‚นใ‚ฟใ‚’ใ‚ฝใƒ•ใƒˆใซๅ‰ฒใ‚Šๅฝ“ใฆใ‚‹ โ€ข ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎใ‚ใ‚‹ๆฅต้™ใจใ—ใฆK-meansใŒๅฐŽใ‹ใ‚Œใ‚‹ใ“ใจใ‚’่ชฌๆ˜Žใ™ใ‚‹ใ€‚ - ๅ„ใ‚ฌใ‚ฆใ‚น่ฆ็ด ใฎๅ…ฑๅˆ†ๆ•ฃ่กŒๅˆ—ใŒ ๐œ–๐ˆ ใงไธŽใˆใ‚‰ใ‚Œใ‚‹ใ‚ฑใƒผใ‚นใซใคใ„ใฆ่€ƒใˆใ‚‹ใ€‚ โžข ๐œ– ใฏๅˆ†ๆ•ฃใƒ‘ใƒฉใƒกใƒผใ‚ฟใ€๐ˆ ใฏๅ˜ไฝ่กŒๅˆ— ๐‘ ๐ฑ ๐๐‘˜ , ๐šบ๐‘˜ = 1 2๐œ‹ ๐ท 2 1 ๐œ–๐ˆ 1 2 exp โˆ’ 1 2 ๐ฑ โˆ’ ๐๐‘˜ T ๐œ–๐ˆ โˆ’1 ๐ฑ โˆ’ ๐๐‘˜ = 1 2๐œ‹๐œ– ๐ท 2 exp โˆ’ 1 2๐œ– ๐ฑ โˆ’ ๐๐‘˜ 2 ๐›พ ๐‘ง๐‘›๐‘˜ = ๐œ‹๐‘˜ exp โˆ’ 1 2๐œ– ๐ฑ โˆ’ ๐๐‘˜ 2 ฯƒ ๐‘—=1 ๐พ ๐œ‹๐‘— exp โˆ’ 1 2๐œ– ๐ฑ โˆ’ ๐๐‘— 2 (9.41) (9.42) 36/56
  29. 9.3.2 K-means ใจใฎ้–ข้€ฃ - ใ“ใ“ใงใ€ ๐ฑ๐‘› โˆ’ ๐๐‘— 2 ใŒๆœ€ๅฐใซใชใ‚‹

    ๐‘— ใ‚’ ๐‘—โˆ— ใจใŠใใ€‚ - ๅˆ†ๆ•ฃใƒ‘ใƒฉใƒกใƒผใ‚ฟ ๐œ– โ†’ 0 ใ‚’่€ƒใˆใ‚‹ใจใ€ๅˆ†ๆฏใซใŠใ„ใฆ ๐‘—โˆ— ใซ้–ขใ™ใ‚‹้ …ใŒๆœ€ใ‚‚้…ใ 0 ใซ่ฟ‘ใฅใใ€‚ - ใ‚ˆใฃใฆใ€ๅˆ†ๆฏใจๅˆ†ๅญใซ ๐œ‹๐‘—โˆ— exp โˆ’ 1 2๐œ– ๐ฑ๐‘› โˆ’ ๐๐‘—โˆ— 2 ใ‚’ๆŒใค ๐›พ ๐‘ง๐‘›๐‘—โˆ— ใ ใ‘ใŒ 1 ใซๅŽๆŸใ—ใ€ใใ‚Œไปฅๅค–ใฎ ่ฒ ๆ‹…็އใฏ 0 ใซๅŽๆŸใ—ใฆใ„ใใ€‚ ๐›พ ๐‘ง๐‘›๐‘—โˆ— = ๐œ‹๐‘—โˆ— exp โˆ’ 1 2๐œ– ๐ฑ๐‘› โˆ’ ๐๐‘—โˆ— 2 ฯƒ ๐‘—=1 ๐พ ๐œ‹๐‘— exp โˆ’ 1 2๐œ– ๐ฑ๐‘› โˆ’ ๐๐‘— 2 - ใ‚ˆใฃใฆใ“ใฎๆฅต้™ใงใฏใ€ใƒ‡ใƒผใ‚ฟ็‚นใ‹ใ‚‰ใ‚ฏใƒฉใ‚นใ‚ฟใƒผใธใฎใƒใƒผใƒ‰ใชๅ‰ฒใ‚Šๅฝ“ใฆ๏ผˆ๐‘Ÿ๐‘›๐‘—โˆ— ๏ผ‰ ใซใชใฃใฆใ„ใ‚‹ใ€‚ โžข ใ‚ฝใƒ•ใƒˆใช ๐›พ ๐‘ง๐‘›๐‘˜ ใ‹ใ‚‰ใƒใƒผใƒ‰ใช ๐‘Ÿ๐‘›๐‘˜ ใซๅค‰ใ‚ใฃใฆใ„ใ‚‹ โ€ข ๅฐคๅบฆๆœ€ๅคงๅŒ–ใซใคใ„ใฆใ‚‚ใ€ๆฅต้™ใ‚’่€ƒใˆใ‚Œใฐ K-means ใฎๆญชใฟๅฐบๅบฆ ๐ฝ ใฎๆœ€ๅฐๅŒ–ใจๅŒ็ญ‰ใซใชใฃใฆใ„ใ‚‹ใ€‚ (9.43) (9.1) 37/56
  30. 9.3.3 ๆททๅˆใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒ โ€ข ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใงใฏ้€ฃ็ถšๅ€คๅค‰ๆ•ฐใฎๅˆ†ๅธƒใซใคใ„ใฆ่€ƒใˆใŸใ€‚ โ€ข ๅˆฅใฎไพ‹ใจใ—ใฆใ€ใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒใง่กจใ•ใ‚Œใ‚‹2ๅ€คใฎๅค‰ๆ•ฐใฎๆททๅˆใซใคใ„ใฆ่ญฐ่ซ–ใ™ใ‚‹ใ€‚ - Dๅ€‹ใฎ2ๅ€คๅค‰ๆ•ฐ ๐‘ฅ๐‘– (๐‘–

    = 1, 2 โ€ฆ ๐ท) ใ‚’่€ƒใˆใ‚‹ใ€‚ - ใƒ‘ใƒฉใƒกใƒผใ‚ฟ ๐ = ๐œ‡1 , โ€ฆ ๐œ‡๐ท T ใ‚’ๆŒใคๅ ดๅˆใ€๐ฑ = ๐‘ฅ1 , โ€ฆ ๐‘ฅ๐ท Tใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒใฏไปฅไธ‹ ๐‘ ๐ฑ ๐ = เท‘ ๐‘–=1 ๐ท ๐œ‡ ๐‘– ๐‘ฅ๐‘– 1 โˆ’ ๐œ‡๐‘– (1โˆ’๐‘ฅ๐‘–) - ๐ ใŒไธŽใˆใ‚‰ใ‚Œใฆใ„ใ‚‹ๅ ดๅˆใ€ๅ„ๅค‰ๆ•ฐ ๐‘ฅ๐‘– ใฏ็‹ฌ็ซ‹ใชใฎใงใ€ๅนณๅ‡ใจๅ…ฑๅˆ†ๆ•ฃ่กŒๅˆ—ใฏไปฅไธ‹ ๐”ผ ๐ฑ = ๐ var ๐‘ฅ๐‘– = ๐”ผ ๐‘ฅ โˆ’ ๐”ผ ๐‘ฅ๐‘– 2 = ๐”ผ ๐‘ฅ2 โˆ’ 2๐”ผ ๐‘ฅ๐‘– ๐‘ฅ๐‘– + ๐”ผ ๐‘ฅ๐‘– 2 = ๐”ผ ๐‘ฅ๐‘– 2 โˆ’ ๐”ผ ๐‘ฅ๐‘– 2 = ๐œ‡๐‘– โˆ’ ๐œ‡๐‘– 2 cov ๐ฑ = diag ๐œ‡๐‘– (1 โˆ’ ๐œ‡๐‘– ) (9.44) ๐”ผ ๐‘ฅ๐‘– 2 = เท ๐‘ฅ๐‘– ๐‘ฅ๐‘– 2๐‘ ๐‘ฅ๐‘– ๐œ‡๐‘– = เท 0 1 ๐‘ฅ๐‘– 2๐‘ ๐‘ฅ๐‘– ๐œ‡๐‘– = ๐œ‡๐‘– 38/56
  31. 9.3.3 ๆททๅˆใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒ โ€ข Nๅ€‹ใฎใƒ‡ใƒผใ‚ฟ้›†ๅˆ ๐— = {๐ฑ1 , โ€ฆ ๐ฑ๐‘

    } ใŒไธŽใˆใ‚‰ใ‚Œใฆใ„ใ‚‹ใจใใ€ๅฏพๆ•ฐๅฐคๅบฆใฏไปฅไธ‹ - ๅ‘จ่พบๅˆ†ๅธƒใฎๅฐคๅบฆใชใฎใงๅฏพๆ•ฐใฎไธญใซ ๐‘(๐ฑ๐‘› |๐๐‘˜ ) ใฎๅ’ŒใŒๅ…ฅใฃใฆใŠใ‚Šใ€ๆœ€ๅฐค่งฃใฏ้™ฝใซๅพ—ใ‚‰ใ‚Œใชใ„ใ€‚ โžข ๆฝœๅœจๅค‰ๆ•ฐใ‚’ๅฐŽๅ…ฅใ—ใ€EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใ‚’ๅˆฉ็”จใ™ใ‚‹ใ€‚ โ€ข ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใฎใจใใจๅŒใ˜ 1-of-K ็ฌฆๅทๅŒ–ใ—ใŸ ๐ณ = (๐‘ง1 , โ€ฆ , ๐‘ง๐พ ) ใ‚’็”จๆ„ใ™ใ‚‹ใ€‚ โ€ข ๐ณใ‚’ไธŽใˆใ‚‰ใ‚ŒใŸๆกไปถไธ‹ใงใฎ ๐ฑ ใฎ็ขบ็އใจใ€ ๐ณ ใฎ็ขบ็އใฏไปฅไธ‹ใง่กจใ•ใ‚Œใ‚‹ใ€‚ โ€ข ๅฎŒๅ…จใƒ‡ใƒผใ‚ฟๅฏพๆ•ฐๅฐคๅบฆใ‚’ๆ›ธใไธ‹ใ™ใจใ€ไปฅไธ‹ใซใชใ‚‹ใ€‚ๅฏพๆ•ฐใŒ ๐œ‡๐‘˜๐‘– ใซ็›ดๆŽฅไฝœ็”จใ—ใฆใ„ใ‚‹ใ€‚ (9.51) (9.52) (9.53) (9.54) 40/56
  32. 9.3.3 ๆททๅˆใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒ โ€ข ๆททๅˆใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒใฏๆ‰‹ๆ›ธใๆ–‡ๅญ—ใฎๅˆ†้กžใชใฉใซๅˆฉ็”จๅฏ่ƒฝ - ๆ•ฐๅญ—ใฎ 2, 3, 4 ใฎๆ‰‹ๆ›ธใๆ–‡ๅญ—ใƒ‡ใƒผใ‚ฟใŒ600ๅ€‹ใ‚ใ‚‹ใ€‚ใƒ‡ใƒผใ‚ฟ้›†ๅˆ

    ๐— = {๐ฑ1 , โ€ฆ ๐ฑ600 } ใซใ‚ใŸใ‚‹ใ€‚ - ใƒ”ใ‚ฏใ‚ปใƒซๆ•ฐใŒ ๐ท ใจใ™ใ‚‹ใจใ€๐ฑ๐‘› ๅŠใณ ๐๐‘˜ ใฎๆฌกๅ…ƒๆ•ฐใŒ ๐ท - ๐‘ฅ๐‘– ใฏ2ๅ€คๅค‰ๆ•ฐใงใ‚ใ‚Šใ€ ๐‘ฅ๐‘– = 1 ใฎใƒ”ใ‚ฏใ‚ปใƒซใฏ้ป’ใ€ ๐‘ฅ๐‘– ใฏ็ขบ็އ ๐œ‡๐‘– ใง้ป’ใใชใ‚‹ - ๆ•ฐๅญ—ใฎ 2, 3, 4 ใซใคใ„ใฆใ€ใ‚ฏใƒฉใ‚น ๐‘˜ = {2, 3, 4} ใ‚’ๅ‰ฒใ‚Šๅฝ“ใฆใ‚‹ใ€‚ - EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใ‚’้ฉ็”จใ™ใ‚Œใฐใ€ใ‚ฏใƒฉใ‚นๆฏŽใซ ๐ท ๆฌกๅ…ƒใƒ™ใ‚ฏใƒˆใƒซ ๐๐‘˜ ใŒๅพ—ใ‚‰ใ‚Œใ‚‹ใ€‚ ใƒ”ใ‚ฏใ‚ปใƒซ็”ปๅƒ ๐œ‡๐Ÿ1 ๐œ‡๐Ÿ2 โ€ฆ ๐œ‡๐Ÿ๐ท k = 2 ๐œ‡๐Ÿ‘1 ๐œ‡๐Ÿ‘2 โ€ฆ ๐œ‡๐Ÿ‘๐ท k = 3 ๐œ‡๐Ÿ’1 ๐œ‡๐Ÿ’2 โ€ฆ ๐œ‡๐Ÿ’๐ท k = 4 42/56
  33. 9.3.3 ๆททๅˆใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒ โ€ข ้ฉๅˆ‡ใซๅˆๆœŸๅ€คใ‚’้ธใ‚“ใงEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใ‚’10ๅ›ž็นฐใ‚Š่ฟ”ใ—ใŸใ€‚ - ๆททๅˆไฟ‚ๆ•ฐ ๐œ‹๐‘˜ ใฏ 1/K ใงๅˆๆœŸๅŒ–ใ€

    ๐œ‡๐‘˜๐‘– ใฏ (0.25, 0.75) ใฎไธ€ๆง˜ๅˆ†ๅธƒใ‹ใ‚‰ใ‚ตใƒณใƒ—ใƒชใƒณใ‚ฐใงๅˆๆœŸๅŒ– - ไธ‹ๅ›ณใฏ ๐œ‡๐‘˜๐‘– ใฎๅ€คใ‚’ใ‚ฐใƒฌใƒผใ‚นใ‚ฑใƒผใƒซใง่กจใ—ใŸใ‚‚ใฎ โžข 0 ใŒ ็™ฝใ€1ใŒ้ป’ โ€ข ๅ˜ไธ€ใฎใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒใ ใจไธ‹ๅ›ณใฎใ‚ˆใ†ใซใชใ‚‹ใ€‚ - ๅ…จใฆใฎใ‚ฏใƒฉใ‚นใ‚’ไธ€ใคใฎใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒใงๅญฆ็ฟ’ใ—ใฆใ„ใ‚‹ใฎใงใ€ ใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆใ‹ใ‚‰ๅ„ใƒ”ใ‚ฏใ‚ปใƒซใŒ้ป’ใใชใ‚‹็ขบ็އใ‚’ๅนณๅ‡ใงๅ‡บใ—ใฆใ„ใ‚‹ใ ใ‘ k = 2 k = 4 k = 3 43/56
  34. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข ใ“ใ“ใพใงใ‚„ใฃใฆใใŸEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฏใ€ๆฝœๅœจๅค‰ๆ•ฐใ‚’ๆŒใค็ขบ็އใƒขใƒ‡ใƒซใฎๆœ€ๅฐค่งฃใ‚’ๆฑ‚ใ‚ใ‚‹ใŸใ‚ใฎไธ€่ˆฌ็š„ใช ๆ‰‹ๆณ•ใงใ‚ใ‚‹ใ€‚ โ€ข 9.4 ็ฏ€ใงใฏใ€EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใŒๆฏŽใ‚นใƒ†ใƒƒใƒ—็ขบใ‹ใซๅฐคๅบฆ้–ขๆ•ฐใ‚’ๆฅตๅคงๅŒ–ใ•ใ›ใ‚‹ใ“ใจใ‚’็คบใ™ใ€‚ - ใ“ใ‚ŒใพใงใจๅŒๆง˜ใซใ€

    ๐‘ ๐— ๐œฝ ใฎๆœ€ๅคงๅŒ–ใŒๅ›ฐ้›ฃใงใ‚ใ‚‹ใŒ ๐‘ ๐—, ๐™ ๐œฝ ใฎๆœ€ๅคงๅŒ–ใฏๅฎนๆ˜“ใงใ‚ใ‚‹ใจไปฎๅฎšใ™ใ‚‹ใ€‚ ln๐‘ ๐— ๐œƒ = ln เท ๐™ ๐‘ ๐—, ๐™ ๐œฝ โ€ข ๅฏพๆ•ฐใŒๅŒๆ™‚็ขบ็އใฎๅ’Œใซไฝœ็”จใ—ใฆใ„ใ‚‹ใฎใง่งฃๆž็š„ใช่งฃใŒๅพ—ใ‚‰ใ‚Œใชใ„ใ€‚ โ€ข ใ“ใ“ใซใ€ๆฝœๅœจๅค‰ๆ•ฐใซใคใ„ใฆๅˆ†ๅธƒ ๐‘ž(๐™) ใ‚’ๅฐŽๅ…ฅใ™ใ‚‹ใจใ€ ln๐‘ ๐— ๐œƒ ใฏไปฅไธ‹ใฎใ‚ˆใ†ใซ2ใคใฎ้ …ใซๅˆ†่งฃใงใใ‚‹ใ€‚ โ€ข โ„’ ๐‘ž, ๐œฝ ใฏ evidence lower bound ใจๅ‘ผใฐใ‚Œใ‚‹ใ€‚ - ๅ‘จ่พบๅฐคๅบฆใฏ marginal likelihood ไปฅๅค–ใซ evidence ใจๅ‘ผใฐใ‚Œใ‚‹ใ“ใจใ‚‚ใ‚ใ‚‹ใŸใ‚ใ€‚ (9.70) (9.70) (9.71) (9.72) 45/56
  35. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข ๅฐŽๅ‡บโ‘  ln๐‘ ๐— ๐œƒ = เท ๐™

    ๐‘ž ๐™ ln๐‘ ๐— ๐œฝ = เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ ๐™|๐—, ๐œฝ = เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ ๐‘ž ๐™ ๐‘ ๐™|๐—, ๐œฝ = เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ + เท ๐™ ๐‘ž ๐™ ln ๐‘ž ๐™ ๐‘ ๐™|๐—, ๐œฝ = โ„’ ๐‘ž, ๐œฝ + KL ๐‘ž||๐‘ เท ๐™ ๐‘ž(๐™) = 1 โ€ข KLใƒ€ใ‚คใƒใƒผใ‚ธใ‚งใƒณใ‚นใŒ้ž่ฒ  (ยง1.6) ใงใ‚ใ‚‹ใฎใงใ€ KL ๐‘ž||๐‘ = ln๐‘ ๐— ๐œƒ โˆ’ โ„’ ๐‘ž, ๐œฝ โ‰ฅ 0 ln๐‘ ๐— ๐œƒ โ‰ฅ โ„’ ๐‘ž, ๐œฝ - โ„’ ๐‘ž, ๐œฝ ใŒ evidence lower bound ใงใ‚ใ‚‹ใ“ใจใŒๅˆ†ใ‹ใ‚‹ใ€‚ 46/56
  36. 1.6.1 ๅพฉ็ฟ’ โ€ข KL(๐‘| ๐‘ž ใฏ้ž่ฒ ใงใ‚ใ‚‹ใ“ใจใฎ่จผๆ˜Ž - ้–ขๆ•ฐ ๐‘“ ๐‘ฅ

    ใงใ€ๅ…จใฆใฎๅผฆใŒ้–ขๆ•ฐใซไน—ใฃใฆใ„ใ‚‹ใ‹ใใ‚Œใ‚ˆใ‚Šใ‚‚ไธŠใงใ‚ใ‚‹ใจใๅ‡ธใงใ‚ใ‚‹ใจๅ‘ผใถใ€‚ - ๅ›ณ1.31ใงใ€a ใจ b ใ‚’ 1 โˆ’ ๐œ† : ๐œ† ใซๅˆ†ๅ‰ฒใ™ใ‚‹ ๐‘ฅ๐œ† ใ‚’่€ƒใˆใ‚‹ใ€‚ - ๐‘ฅ๐œ† = ๐œ†๐‘Ž + 1 โˆ’ ๐œ† ๐‘ - ๐‘“ ๐‘ฅ ไธŠใฎ็‚นใฏ ๐‘“(๐œ†๐‘Ž + 1 โˆ’ ๐œ† ๐‘) - ๐‘ฅ๐œ† ใจๅผฆใฎไบค็‚นใฏ ๐œ†๐‘“(๐‘Ž) + 1 โˆ’ ๐œ† ๐‘“(๐‘) - ไปฅไธŠใ‚ˆใ‚Šๅ‡ธ้–ขๆ•ฐใงใฏใ€ๅผ1.114 ใŒๆˆ็ซ‹ใ™ใ‚‹ใ€‚ - ๅผ1.114 ใ‹ใ‚‰ใ€ๅธฐ็ดๆณ•ใ‚’ไฝฟใ†ใจไปฅไธ‹ใŒๅพ—ใ‚‰ใ‚Œใ‚‹ใ€‚ - ่จผๆ˜Žใฏๆผ”็ฟ’1.38 - 0 โ‰ค ๐œ† โ‰ค 1 ใงๆˆ็ซ‹ใ™ใ‚‹ใ“ใฎๅผใ‚’ใ‚คใ‚งใƒณใ‚ปใƒณใฎไธ็ญ‰ๅผใจๅ‘ผใถใ€‚ 1.114 ๅ›ณ1.31 ๐œ†๐‘Ž + 1 โˆ’ ๐œ† ๐‘ ๐œ†๐‘“(๐‘Ž) + (1 โˆ’ ๐œ†)๐‘“(๐‘) ๐‘“(๐œ†๐‘Ž + 1 โˆ’ ๐œ† ๐‘) 1.115 47/56
  37. 1.6.1 ๅพฉ็ฟ’ โ€ข ้€ฃ็ถšๅค‰ๆ•ฐใงใฏๆฌกใฎใ‚ˆใ†ใซใชใ‚‹ - ๐œ† (0 โ‰ค ๐œ† โ‰ค

    1) ใŒ ๐‘(๐ฑ) ใซ็ฝฎใๆ›ใ‚ใฃใฆใ„ใ‚‹ โ€ข ๅผ1.117 ใ‚’ KLใƒ€ใ‚คใƒใƒผใ‚ธใ‚งใƒณใ‚นใซ้ฉ็”จใ™ใ‚‹ใจ - ๐‘“ ๐‘ฅ = โˆ’ln(๐ฑ) ใจใ—๏ผŒ โˆ’ln(๐ฑ) ใŒๅ‡ธ้–ขๆ•ฐใงใ‚ใ‚‹ใ“ใจใจ โˆซ ๐‘ž ๐ฑ ๐‘‘๐ฑ = 1 ใ‚’ๅˆฉ็”จ - ็ญ‰ๅทใฏๅ…จใฆใฎ ๐ฑ ใซใคใ„ใฆ ๐‘ ๐ฑ = ๐‘ž(๐ฑ) ใฎๆ™‚ใซ้™ใ‚Šๆˆ็ซ‹ โ€ข KLใƒ€ใ‚คใƒใƒผใ‚ธใ‚งใƒณใ‚นใฏ ๐‘ ๐ฑ ใจ ๐‘ž(๐ฑ) ใฎใจใฎ้š”ใŸใ‚Šใ‚’่กจใ™ๅฐบๅบฆใจใ—ใฆ่งฃ้‡ˆๅฏ่ƒฝ - ใŸใ ใ— KL(๐‘| ๐‘ž โ‰  KL(๐‘ž| ๐‘ ใงใ‚ใ‚‹ใŸใ‚ใ€่ท้›ขใงใฏใชใ„ใ“ใจใซๆณจๆ„ 1.117 48/56
  38. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข ๅฐŽๅ‡บ โ‘ก - ๅฏพๆ•ฐๅ‘จ่พบๅฐคๅบฆใซใ‚คใ‚งใƒณใ‚ปใƒณใฎไธ็ญ‰ๅผใ‚’้ฉ็”จใ™ใ‚‹ใƒใƒผใ‚ธใƒงใƒณ ln๐‘ ๐— ๐œฝ

    = ln เท ๐™ ๐‘ ๐—, ๐™ ๐œฝ = ln เท ๐™ ๐‘ž ๐™ ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ ใ“ใ“ใซใ‚คใ‚งใƒณใ‚ปใƒณใฎไธ็ญ‰ๅผ๏ผˆยง1.6๏ผ‰ใ‚’้ฉ็”จ ๐‘“ เท ๐‘–=1 ๐‘› ๐œ†๐‘– ๐‘ฅ๐‘– โ‰ฅ เท ๐‘–=1 ๐‘› ๐œ†๐‘– ๐‘“(๐‘ฅ๐‘– ) , ๐‘คโ„Ž๐‘’๐‘Ÿ๐‘’ เท ๐‘–=1 ๐‘› ๐œ†๐‘– = 1 ln๐‘ ๐— ๐œฝ = ln เท ๐™ ๐‘ž ๐™ ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ โ‰ฅ เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ = โ„’ ๐‘ž, ๐œฝ 49/56
  39. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  - ๅฏพๆ•ฐๅ‘จ่พบๅฐคๅบฆใจ lower bound ใฎๅทฎๅˆ†ใ‚’่จˆ็ฎ— (9.70) ln๐‘ ๐—

    ๐œฝ โˆ’ เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ = ln๐‘ ๐— ๐œฝ เท ๐™ ๐‘ž ๐™ โˆ’ เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ = เท ๐™ ๐‘ž ๐™ ln๐‘ ๐— ๐œฝ โˆ’ ln๐‘ ๐—, ๐™ ๐œฝ + ln๐‘ž ๐™ = เท ๐™ ๐‘ž ๐™ ln๐‘ ๐— ๐œฝ โˆ’ ln๐‘ ๐™ ๐—, ๐œฝ โˆ’ ln๐‘ ๐— ๐œฝ + ln ๐‘ž ๐™ = โˆ’ เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐™ ๐—, ๐œฝ ๐‘ž ๐™ = KL ๐‘ž||๐‘ ln๐‘ ๐— ๐œฝ โˆ’ โ„’ ๐‘ž, ๐œฝ = KL ๐‘ž||๐‘ ๅผ(9.70) ใฎใ‚คใƒกใƒผใ‚ธ ๅ›ณ9.11 ln๐‘ ๐— ๐œฝ ใฃใฆ่ฒ ใ˜ใ‚ƒใชใ„ใฎ๏ผŸ 50/56
  40. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใŒๅฏพๆ•ฐๅฐคๅบฆใ‚’ๅข—ๅŠ ใ•ใ›ใฆใ„ใใ“ใจใฎ่ชฌๆ˜Ž - Eใ‚นใƒ†ใƒƒใƒ— โžข ็พๅœจใฎใƒ‘ใƒฉใƒกใƒผใ‚ฟใƒ™ใ‚ฏใƒˆใƒซใŒ ๐œฝ๐‘œ๐‘™๐‘‘ ใงใ‚ใ‚‹ใจไปฎๅฎšใ™ใ‚‹ใ€‚

    โžข Eใ‚นใƒ†ใƒƒใƒ—ใงใฏใ€ ๐œฝ๐‘œ๐‘™๐‘‘ ใ‚’ๅ›บๅฎšใ—ใŸ็Šถๆ…‹ใงใ€ไธ‹็•Œ โ„’ ๐‘ž, ๐œฝ ใ‚’๐‘ž(๐™) ใซใคใ„ใฆๆœ€ๅคงๅŒ–ใ™ใ‚‹ใ€‚ โžข KLใƒ€ใ‚คใƒใƒผใ‚ธใ‚งใƒณใ‚นใŒ 0 ใฎๆ™‚ใ€ โ„’ ๐‘ž, ๐œฝ ใŒๆœ€ๅคงใ€‚ โžข โ†’ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ = ๐‘ž(๐™) ใฎใจใใซ โ„’ ๐‘ž, ๐œฝ๐‘œ๐‘™๐‘‘ ใŒๆœ€ๅคงใซใชใ‚‹ใ€‚ โžขๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใงใ„ใ†ใจใ“ใ‚ใฎ ่ฒ ๆ‹…็އ ๐›พ ๐‘ง๐‘›๐‘˜ = ๐‘ ๐‘ง๐‘›๐‘˜ = 1 ๐—, ๐œฝ ใฎ่จˆ็ฎ— KL ๐‘ž||๐‘ = โˆ’ เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ๐‘ž ๐™ = 0 โ‡” ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ = ๐‘ž(๐™) ๅ›ณ9.11 ln๐‘ ๐— ๐œฝ = โ„’ ๐‘ž, ๐œฝ + KL ๐‘ž||๐‘ ๐‘ž(๐™) ใซไพๅญ˜ใ—ใชใ„ ๐œฝ๐‘œ๐‘™๐‘‘ใฏๅ›บๅฎšใ—ใŸใพใพ ๐‘žใ‚’ๅ‹•ใ‹ใ—ใฆๆœ€ๅคงๅŒ–ใ—ใŸใ„ โ†’KLDใ‚’0ใซ ใ™ใ‚Œใฐใ‚ˆใ„ ๅ›ณ9.12 51/56
  41. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใŒๅฏพๆ•ฐๅฐคๅบฆใ‚’ๅข—ๅŠ ใ•ใ›ใฆใ„ใใ“ใจใฎ่ชฌๆ˜Ž - Mใ‚นใƒ†ใƒƒใƒ— โžข ๐‘ž ๐™ =

    ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ใ‚’ๅ›บๅฎšใ—ใŸ็Šถๆ…‹ใงใ€ โ„’ ๐‘ž, ๐œฝ ใ‚’ใƒ‘ใƒฉใƒกใƒผใ‚ฟ ๐œฝ ใซใคใ„ใฆๆœ€ๅคงๅŒ–ใ™ใ‚‹ใ€‚ โžข ln๐‘ ๐— ๐œฝ ใ€KLD ใ‚‚ ๐œฝ ใซไพๅญ˜ใ™ใ‚‹ใฎใงๅ‹ๆ‰‹ใซๅข—ๅŠ ใ™ใ‚‹ใ€‚ โžข ๐‘ž(๐™)ใ‚’ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ใซ็ฝฎใๆ›ใˆใŸใจใใฎไธ‹็•Œใ‚’่จˆ็ฎ— โ„’ ๐‘ž, ๐œฝ = เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ž ๐™ = เท ๐™ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln ๐‘ ๐—, ๐™ ๐œฝ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ = เท ๐‘ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln ๐‘ ๐—, ๐™ ๐œฝ โˆ’ เท ๐‘ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln๐‘ ๐— ๐œฝ = โ„’ ๐‘ž, ๐œฝ + KL ๐‘ž||๐‘ ๐œฝใซไพๅญ˜ใ—ใฆใ„ใ‚‹ ใฎใงๅค‰ๅŒ–ใ™ใ‚‹ ๐‘ž ๐™ = ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ใฏๅ›บๅฎšใ—ใ€ ๐œฝ ใซใคใ„ใฆๆœ€้ฉๅŒ–ใ™ใ‚‹ ๐œฝใซไพๅญ˜ใ—ใฆใ„ใ‚‹ ใฎใงๅค‰ๅŒ–ใ™ใ‚‹ ใ“ใฎ้ …ใฏ ๐œฝ ใซไพๅญ˜ใ—ใชใ„ใฎใงๅฎšๆ•ฐ ๐œฝ ใซใคใ„ใฆๆœ€้ฉๅŒ–ใ™ใ‚‹ใŸใ‚ใซใ€ใ“ใฎ้ …ใฎๅพฎๅˆ†ใ‚’่จˆ็ฎ—ใ™ใ‚‹ใฎใง ๐‘ ๐—, ๐™ ๐œฝ ใฎๆœ€ๅคงๅŒ–ใฏๅฎนๆ˜“ใงใ‚ใ‚‹ใจไปฎๅฎšใŒๅคงไบ‹ 52/56
  42. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  53 โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใŒๅฏพๆ•ฐๅฐคๅบฆใ‚’ๅข—ๅŠ ใ•ใ›ใฆใ„ใใ“ใจใฎ่ชฌๆ˜Ž - โ„’ ๐‘ž, ๐œฝ ใฎ็ฌฌ1้ …ใฏใ€ไบ‹ๅพŒๅˆ†ๅธƒ

    ๐‘(๐™|๐—, ๐œฝ๐‘œ๐‘™๐‘‘) ใฎๅŸบใงใฎ ln๐‘ ๐—, ๐™ ๐œฝ ใฎๆœŸๅพ…ๅ€คใซใชใฃใฆใ„ใ‚‹ใ€‚ โ„’ ๐‘ž, ๐œฝ = เท ๐‘ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln ๐‘ ๐—, ๐™ ๐œฝ โˆ’ เท ๐‘ ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ln ๐‘ ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ = ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ + const. โžข ใคใพใ‚ŠMใ‚นใƒ†ใƒƒใƒ—ใงใฏใ€ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใง่ชฌๆ˜Žใ—ใŸ ๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ ใฎๆœ€ๅคงๅŒ–ใ‚’่กŒใฃใฆใ„ใ‚‹ใ€‚ - Mใ‚นใƒ†ใƒƒใƒ—ใง โ„’ ๐‘ž, ๐œฝ ใ‚’ ๐œฝ ใซๅฏพใ—ใฆๆœ€้ฉๅŒ–ใ™ใ‚‹ใ“ใจใง ๐œฝ๐‘›๐‘’๐‘ค ใŒๅพ—ใ‚‰ใ‚Œใ‚‹ใ€‚ โžข ใ“ใฎใจใใ€KLDใฏไปฅไธ‹ใฎใ‚ˆใ†ใซใชใ‚Šใ€๏ผไปฅไธŠใฎๅ€คใ‚’ๆŒใคใ€‚ โžข ใ‚ˆใฃใฆใ€ๅ‘จ่พบๅฐคๅบฆใฎๅข—ๅŠ ๅน…ใฏ โ„’ ๐‘ž, ๐œฝ ใ‚ˆใ‚Šใ‚‚ๅคงใใใชใ‚‹ใ€‚ โˆ’ เท ๐™ ๐‘ž ๐™ ln ๐‘ ๐™ ๐—, ๐œฝ ๐‘ž ๐™ = เท ๐™ ๐‘(๐™|๐—, ๐œฝ๐‘œ๐‘™๐‘‘) ln ๐‘ ๐™ ๐—, ๐œฝ๐‘›๐‘’๐‘ค ๐‘(๐™|๐—, ๐œฝ๐‘œ๐‘™๐‘‘) ๅ›ณ9.12 ๅ›ณ9.13 53/56
  43. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใ‚’ใƒ‘ใƒฉใƒกใƒผใ‚ฟ็ฉบ้–“ใง่ฆ–่ฆšๅŒ– - ๐œฝ๐‘œ๐‘™๐‘‘ ใ‹ใ‚‰ๅง‹ใ‚ใ€ๆœ€ๅˆใฎEใ‚นใƒ†ใƒƒใƒ—ใงไบ‹ๅพŒๅˆ†ๅธƒ ๐‘(๐™|๐—, ๐œฝ๐‘œ๐‘™๐‘‘) ใ‚’่จˆ็ฎ—ใ—ใ€โ„’

    ๐‘ž, ๐œฝ ใŒๅฐŽใ‹ใ‚Œใ‚‹ใ€‚ - Eใ‚นใƒ†ใƒƒใƒ—ใงใฏ KLD=0 ใซใชใ‚‹ใฎใงใ€๐‘ ๐— ๐œฝ๐‘œ๐‘™๐‘‘)ใจโ„’ ๐‘ž, ๐œฝ๐‘œ๐‘™๐‘‘ ใฏไธ€่‡ดใ™ใ‚‹ใ€‚ - ๆŽฅใ™ใ‚‹ไบ‹ใฎ่จผๆ˜Ž (ๆผ”็ฟ’9.25) - ๐œ• ๐œ•๐œฝ KL ๐‘ž||๐‘ | ๐œฝ=๐œฝ๐‘œ๐‘™๐‘‘ = 0 ใ ใ‹ใ‚‰ใ€ ๐œ• ๐œ•๐œฝ ln๐‘ ๐— ๐œฝ) = ๐œ• ๐œ•๐œฝ โ„’ ๐‘ž, ๐œฝ + ๐œ• ๐œ•๐œฝ KL ๐‘ž||๐‘ ๐œ• ๐œ•๐œฝ ln๐‘ ๐— ๐œฝ) แ‰š ๐œฝ=๐œฝ๐‘œ๐‘™๐‘‘ = ๐œ• ๐œ•๐œฝ โ„’ ๐‘ž, ๐œฝ แ‰š ๐œฝ=๐œฝ๐‘œ๐‘™๐‘‘ 54/56
  44. 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  โ€ข EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใ‚’ใƒ‘ใƒฉใƒกใƒผใ‚ฟ็ฉบ้–“ใง่ฆ–่ฆšๅŒ– - ๆฌกใซ ๐‘ž ๐™ = ๐‘

    ๐™ ๐—, ๐œฝ๐‘œ๐‘™๐‘‘ ใ‚’ๅ›บๅฎšใ—ใŸ็Šถๆ…‹ใงใ€ โ„’ ๐‘ž, ๐œฝ ใ‚’ใƒ‘ใƒฉใƒกใƒผใ‚ฟ ๐œฝ ใซใคใ„ใฆๆœ€ๅคงๅŒ–ใ™ใ‚‹ใ“ใจ ใง ๐œฝ๐‘›๐‘’๐‘ค ใ‚’ๅพ—ใ‚‹๏ผˆ Mใ‚นใƒ†ใƒƒใƒ—๏ผ‰ ใ€‚ โžข โ„’ ๐‘ž, ๐œฝ ใ‚’ๆœ€ๅคงๅŒ–ใ—ใŸใฎใง ๐œฝ๐‘›๐‘’๐‘ค ใŒๆฅตๅ€คใซใชใฃใฆใ„ใ‚‹ใ€‚ - ๐œฝ๐‘›๐‘’๐‘ค ใ‚’ไฝฟใฃใฆไบ‹ๅพŒๅˆ†ๅธƒ ๐‘(๐™|๐—, ๐œฝ๐‘œ๐‘™๐‘‘) ใ‚’ ่จˆ็ฎ—ใ—ใ€โ„’ ๐‘ž, ๐œฝ ใŒๅฐŽใ‹ใ‚Œใ‚‹ใ€‚ โžข ไปฅ้™็นฐใ‚Š่ฟ”ใ— 55/56
  45. ใพใจใ‚ โ€ข 9.1 K-means - ๆœ€ใ‚‚ใ‚ทใƒณใƒ—ใƒซใชๆททๅˆใƒขใƒ‡ใƒซใจใ—ใฆK-meansใ‚ฏใƒฉใ‚นใ‚ฟใƒชใƒณใ‚ฐใซใคใ„ใฆ่ชฌๆ˜Žใ—ใŸ โ€ข 9.2 ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒ -

    ๆฝœๅœจๅค‰ๆ•ฐใ‚’้™ฝใซๆ‰ฑใฃใŸๅ ดๅˆใฎๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใ‚’ๅฐŽๅ…ฅใ—ใŸใ€‚ - ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใงใฏๅฏพๆ•ฐๅฐคๅบฆใฎๆœ€ๅคงๅŒ–ใŒใซๅ•้กŒใŒใ‚ใ‚‹ใ€‚ - ่ฒ ๆ‹…็އใฎ่จˆ็ฎ—๏ผˆEใ‚นใƒ†ใƒƒใƒ—๏ผ‰ใจๆททๅˆใƒขใƒ‡ใƒซใฎใƒ‘ใƒฉใƒกใƒผใ‚ฟๆ›ดๆ–ฐ๏ผˆMใ‚นใƒ†ใƒƒใƒ—๏ผ‰ใซใ‚ˆใฃใฆใ‚ฏใƒฉใ‚นใ‚ฟใƒช ใƒณใ‚ฐใŒใงใใ‚‹ใ“ใจใ‚’็คบใ—ใŸใ€‚ โ€ข 9.3 EMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใฎ่งฃ้‡ˆ - ไธ€่ˆฌๅŒ–ใ—ใŸEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ใ‚’ๅฐŽๅ…ฅใ—ใ€ใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใจใฎ้–ขไฟ‚ใ‚’ๆฏ”่ผƒใ—ใชใŒใ‚‰๐’ฌ ๐œฝ, ๐œฝ๐‘œ๐‘™๐‘‘ ใ‚’ๅฐŽๅ‡บใ— ใŸใ€‚ - ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใซใŠใ„ใฆใ€ๅˆ†ๆ•ฃใƒ‘ใƒฉใƒกใƒผใ‚ฟใ‚’0ใซ่ฟ‘ใฅใ‘ใ‚‹ใ“ใจใงใ€ใ‚ฏใƒฉใ‚นใฎๅ‰ฒใ‚Šๅฝ“ใฆใ‚’ใ‚ฝใƒ•ใƒˆ ใช่ฒ ๆ‹…็އใ‹ใ‚‰ใƒใƒผใƒ‰ใชๆ–นๆณ•ใซๅค‰ใˆใ€็ตๆžœ็š„ใซK-meansใจๅŒ็ญ‰ใงใ‚ใ‚‹ใ“ใจใ‚’ๅฐŽใ„ใŸใ€‚ - ๆททๅˆใ‚ฌใ‚ฆใ‚นๅˆ†ๅธƒใจๆททๅˆใƒ™ใƒซใƒŒใƒผใ‚คๅˆ†ๅธƒใซใŠใ„ใฆใ€ๅฏพๆ•ฐๅ‘จ่พบๅฐคๅบฆใงใฏ่จˆ็ฎ—ใŒๅ›ฐ้›ฃใ ใฃใŸๅพฎๅˆ†ใŒใ€ ๅฎŒๅ…จใƒ‡ใƒผใ‚ฟๅฏพๆ•ฐๅฐคๅบฆใงใฏ็ฐกๅ˜ใซใชใ‚‹ใ“ใจใ‚’่ฆ‹ใŸใ€‚ โ€ข 9.4 ไธ€่ˆฌใฎEMใ‚ขใƒซใ‚ดใƒชใ‚บใƒ  - Eใ‚นใƒ†ใƒƒใƒ—ใจMใ‚นใƒ†ใƒƒใƒ—ใฎ็นฐใ‚Š่ฟ”ใ—ใŒใ€ๅธธใซๅฏพๆ•ฐๅ‘จ่พบๅฐคๅบฆใ‚’ๅข—ๅŠ ใ•ใ›ใ‚‹ใ“ใจใ‚’็คบใ—ใŸใ€‚ 56/56