Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
輪読 / topic model3.1, 3.2
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ysekky
December 22, 2015
Research
340
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
輪読 / topic model3.1, 3.2
ysekky
December 22, 2015
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.4k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.9k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
830
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.3k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.5k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4.1k
Other Decks in Research
See All in Research
通時的な類似度行列に基づく単語の意味変化の分析
rudorudo11
0
310
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
990
オーストリア流 都市の公共交通サービス水準評価@公共交通オープンデータ最前線2026
trafficbrain
0
180
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2.2k
Claude Code × autoresearch 実践
mathbullet
0
160
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
160
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
1.3k
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
560
NLP colloquium: AI Safety Survey
kanekomasahiro
0
660
CVPR2026論文紹介_VLMにとって良いvision encoderとは何か?Rethinking Model Selection in VLM Through the Lens of Gromov-Wasserstein Distance
kobayashi31
1
110
Harness Engineering and Al Agent
kzinmr
3
1.7k
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
280
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
330
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
The Cult of Friendly URLs
andyhume
79
6.9k
Building an army of robots
kneath
306
46k
Amusing Abliteration
ianozsvald
1
200
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
56k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
Ruling the World: When Life Gets Gamed
codingconduct
0
250
Facilitating Awesome Meetings
lara
57
7k
Transcript
τϐοΫϞσϧʹΑΔ౷ܭతજࡏҙຯ ղੳ 3ষ ֶशΞϧΰϦζϜ(3.1 ~ 3.2.2) Yoshifumi Seki GunosyσʔλϚΠχϯάݚڀձ #97
2015.12.21
3.1 ౷ܭతֶशΞϧΰϦζϜ ౷ܭతֶश: ؍ଌσʔλͷഎޙʹજΉϧʔϧɾنଇΛ౷ܭతʹهड़ ͠ɼσʔλ͔Βࣗಈతʹ֫ಘ͢ΔֶशͷΈ ؍ଌσʔλ ؍ଌσʔλΛੜͨ֬͠ ੜϞσϧ ɹʹͰ͖Δ͚͍ͩۙ֬ ɹΛਪఆ͢Δ
KL-divergence ౷ܭϞσϧͷۙ͞Λද͢ࢦඪ ͜ΕʹΑΓɼ ʹ͍ۙ֬Λਪఆ͢Δͱ͍͏KLΛ ࠷খԽ͢Δͱ͍͏ʹͳΔ
KL-divegenceͷ࠷খԽ ͷظΛ ͱ͢ΔͱҎԼͷΑ͏ʹల։Ͱ͖Δ ͷ߲ແࢹͰ͖ΔͷͰ࠷খԽҎԼͷΑ͏ʹͳΔ
ظܭࢉͷۙࣅ ະͳͷͰ؍ଌσʔλΛਅͷ͔ΒಘΒΕͨαϯϓϧͱͯۙ͠ࣅΛߦ͏ɽ ͜ͷํ๏࠷ਪఆ(Maximum Likelihood estimation)ͱݺΕ, ࠷ਪఆʹΑͬͯΒΕΔղΛ ͱ͢Δ
ੜϞσϧͱͯ͠ߟ͑Δ σʔλ ͷੜ֬ ࠷ਪఆ͜ͷੜ֬ͷରΛ࠷େʹ͢Δ ΛٻΊΔ͜ͱͰ ͋Δͱ͍͑Δɽ
MAPਪఆ ͱ͢Δͱੜ֬ ͱͳΓ࠷దԽҎԼ ͷΑ͏ʹ͔͚Δ աֶशΛ͙ͨΊͷਖ਼ଇԽ߲ͱͯ͠ػೳ͍ͯ͠ΔͨΊ, ࠷ਪ ఆΑΓ൚Խੑೳ͕ߴֶ͍श͕ظͰ͖Δɽ ͜ΕΛࣄޙ֬࠷େ(Maxmux a Posteriori,
MAP)ਪఆͱݺͿɽ
ࣄޙ֬ ࣄޙ֬ϕΠζͷఆཧʹΑͬͯҎԼͷΑ͏ʹٻΊΒΕΔɽ MAPਪఆ͜ͷࣄޙ͕֬࠷େͱͳΔ ΛٻΊΔͱͳΔ
ϕΠζਪఆ ࠷ਪఆMAPਪఆύϥϝʔλͷΛਪఆ͢ΔͨΊਪఆͱݺΕΔ ਪఆ͞ΕͨύϥϝʔλʹΑͬͯ৽ͨͳσʔλ ͷ༧ଌ ΛٻΊΔ͜ͱ ͕Ͱ͖Δ ͦΕʹ͍ͨͯ͠ύϥϝʔλͷࣄޙ͔֬ΒॏΈ͚͞Εͨ༧ଌΛٻΊΔํ ๏ΛϕΠζਪఆͱݺͿ ͭ·Γύϥϝʔλࣗମ֬ͱͯ͠දݱ͢Δɽ ͜ͷΑ͏ͳੵܭࢉղੳతʹٻΊΔ͜ͱ͕େͰ͖ͳ͍ͨΊɼ͜ͷۙࣅղΛͲΑ
͏ʹٻΊΔ͔ͱ͍͏ΞϧΰϦζϜ͕ଘࡏ͢Δ
LDAʹ͓͚ΔఆࣜԽ • ؍ଌσʔλ: • ֤σʔλͷજࡏม: • જࡏมͷऔΓ͏Δ: • જࡏมͷऔΓ͏Δͷ֬ม: •
֤જࡏม֬ϕΫτϧ ʹجͮ͘ଟ߲ʹै͏ • \piσΟϦΫΤʹΑͬͯੜ͞ΕΔ
LDAʹ͓͚ΔఆࣜԽ • ͱ ϋΠύʔύϥϝʔλ • ͱɹ ಉ͡
LDAʹ͓͚ΔϕΠζਪఆ ҎԼͷ༧ଌΛٻΊΔͷ͕తͰ͋Δ
3.2 αϯϓϦϯάۙࣅ๏ • αϯϓϦϯάۙࣅ๏ ࣄޙ͔ΒαϯϓϦϯά͞Εͨෳͷύϥϝʔλͷฏۉʹਲ ͬͯ༧ଌΛߦ͏ • ΪϒεαϯϓϦϯά • पลԽΪϒεαϯϓϦϯά
αϯϓϦϯά͔Βͷۙࣅܭࢉ ͱͯ͠ࣄޙ͔ΒͷαϯϓϧΛSݸੜ͢Δͱɼ ͱͯۙ͠ࣅܭࢉΛߦ͏͜ͱ͕Ͱ͖Δɽ ࣄޙ͔Βͷαϯϓϧੜ͕Ͱ͖Εۙࣅܭࢉ͕ՄೳͰ͋Δ͕, αϯϓ ϧੜଟ͘ͷ߹ίετ͕ߴ͍ɽ ͜ͷΑ͏ͳ߹ʹଟ͘༻͍ΒΕΔͷ͕ΪϒεαϯϓϦϯάͰ͋Δ
ΪϒεαϯϓϦϯά ΪϒεαϯϓϦϯάͰతͷࣄޙ͔ΒͷαϯϓϧੜΛߦ͏ΘΓ ʹɼαϯϓϧͷܭࢉίετ͕͍͖݅֬Λߏ͠ɼ֬มΛ ަޓʹαϯϓϧੜ͢Δ͜ͱͰɼతͷࣄޙ͔ΒͷαϯϓϧΛੜ͢Δ LDAͰજࡏม ΛαϯϓϦϯάରͱ͢Δ͜ͱͰܭࢉίετͷ͍ ͖݅Λߏ͍ͯ͠Δɽ • ΪϒεαϯϓϦϯάͷྲྀΕ [ࣄޙ]
=> [݁߹] => [ϕΠζͷఆཧʹΑΓల։] => [ఆҼࢠΛ আ֎]
z_iͷαϯϓϦϯά ͔Β ΛऔΓআ͍ͨજࡏมू߹Λ ͱදه͢Δ Ҏ֎ͷͯ͢ͷ֬มΛطͱݻఆ͖ͯ݅֬͠ΛٻΊ Δ
• ʹؔͳ͍߲আڈͯ͠ߟ͑Δ • ݁߹֬ΛϕΠζͷఆཧͰల։͢Δ
(3.18)͔Β(3.19)ʹ͍ͭͯ • ʹ͍ͭͯల։ • ʹରͯ͠د༩͠ͳ͍ͷΛཧ -ɹ ʹ͍ͭͯల։
• ʹد༩͠ͳ͍ͷΛཧ • ʹ͍ͭͯల։
• د༩͠ͳ͍ͷΛཧ • ల։ͯ͠ ʹؔΘΔͷ, ʹؔΘΔͷ͚ͩʹ͢Δ • z_i=kʹؔΘΔͷ͚ͩʹ͢Δ
ਖ਼نԽ߲Λܭࢉ͢Δ • ࢠ͕ܭࢉͰ͖ͨͷͰɼͦΕʹ߹ΘͤͯΛઃఆ͍ͯ͠ Δɻ • z_iͷऔΓ͏ΔΛͯ͢ͱͬͯ૯Λͱ͍ͬͯΔͷͰଟཧ తʹ1ʹͳΔ
ͷ͖݅
3.2.2 पลԽΪϒεαϯϓϦϯά • Λੵফڈ͢Δ͜ͱͰ ΛαϯϓϦϯά͢Δ • ֬มͷੵআڈपลԽͱݺΕΔ͜ͱ͔ΒɼपลԽΪ ϒεαϯϓϦϯάͱݺͿ
ࣄޙͷల։
पลԽͷੵ
ੵܭࢉΛղੳతʹٻΊΔ पลԽΪϒεαϯϓϦϯάΛߦ͏ͨΊʹղੳతʹੵܭࢉ͕Ͱ͖ͳ ͚ΕͳΒͳ͍ ੵࣜࣄޙ֬ʹΑΔظܭࢉͱΈͳ͢͜ͱ͕Ͱ͖ɼ ܭࢉରͷ֬ͷڞࣄલΛ༻͍ͯࣄલΛߏ͢Δ͜ͱ ͰੵܭࢉΛղੳతʹٻΊΔ͜ͱ͕Ͱ͖Δɽ LDAͷ߹σΟϦΫϨͳͷͰ,ҎԼͷఆཧʹै͏
࠷ॳͷ͜Ζͷσʔλഁغ͢Δඞཁ͕͋Δ αϯϓϦϯάͰॳظͷࠒͷσʔλॳظʹґଘ͢ΔͷͰഁغ ͢Δඞཁ͕͋Δɽ ͜ͷظؒͷ͜ͱΛburn-in periodͱݺͿ