Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
輪読 / topic model3.1, 3.2
Search
ysekky
December 22, 2015
Research
0
340
輪読 / topic model3.1, 3.2
ysekky
December 22, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.3k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.8k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
810
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.2k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.4k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4k
Other Decks in Research
See All in Research
AI Agentの精度改善に見るML開発との共通点 / commonalities in accuracy improvements in agentic era
shimacos
4
1.3k
LLM-jp-3 and beyond: Training Large Language Models
odashi
1
760
自動運転におけるデータ駆動型AIに対する安全性の考え方 / Safety Engineering for Data-Driven AI in Autonomous Driving Systems
ishikawafyu
0
130
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
110
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
140
LiDARセキュリティ最前線(2025年)
kentaroy47
0
130
Collective Predictive Coding and World Models in LLMs: A System 0/1/2/3 Perspective on Hierarchical Physical AI (IEEE SII 2026 Plenary Talk)
tanichu
1
250
姫路市 -都市OSの「再実装」-
hopin
0
1.6k
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
380
SREのためのテレメトリー技術の探究 / Telemetry for SRE
yuukit
13
3k
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
460
LLM-Assisted Semantic Guidance for Sparsely Annotated Remote Sensing Object Detection
satai
3
470
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.6k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
940
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
250
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
130
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
230
Ethics towards AI in product and experience design
skipperchong
2
190
Everyday Curiosity
cassininazir
0
130
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
130
Designing for Performance
lara
610
70k
How to Think Like a Performance Engineer
csswizardry
28
2.4k
Transcript
τϐοΫϞσϧʹΑΔ౷ܭతજࡏҙຯ ղੳ 3ষ ֶशΞϧΰϦζϜ(3.1 ~ 3.2.2) Yoshifumi Seki GunosyσʔλϚΠχϯάݚڀձ #97
2015.12.21
3.1 ౷ܭతֶशΞϧΰϦζϜ ౷ܭతֶश: ؍ଌσʔλͷഎޙʹજΉϧʔϧɾنଇΛ౷ܭతʹهड़ ͠ɼσʔλ͔Βࣗಈతʹ֫ಘ͢ΔֶशͷΈ ؍ଌσʔλ ؍ଌσʔλΛੜͨ֬͠ ੜϞσϧ ɹʹͰ͖Δ͚͍ͩۙ֬ ɹΛਪఆ͢Δ
KL-divergence ౷ܭϞσϧͷۙ͞Λද͢ࢦඪ ͜ΕʹΑΓɼ ʹ͍ۙ֬Λਪఆ͢Δͱ͍͏KLΛ ࠷খԽ͢Δͱ͍͏ʹͳΔ
KL-divegenceͷ࠷খԽ ͷظΛ ͱ͢ΔͱҎԼͷΑ͏ʹల։Ͱ͖Δ ͷ߲ແࢹͰ͖ΔͷͰ࠷খԽҎԼͷΑ͏ʹͳΔ
ظܭࢉͷۙࣅ ະͳͷͰ؍ଌσʔλΛਅͷ͔ΒಘΒΕͨαϯϓϧͱͯۙ͠ࣅΛߦ͏ɽ ͜ͷํ๏࠷ਪఆ(Maximum Likelihood estimation)ͱݺΕ, ࠷ਪఆʹΑͬͯΒΕΔղΛ ͱ͢Δ
ੜϞσϧͱͯ͠ߟ͑Δ σʔλ ͷੜ֬ ࠷ਪఆ͜ͷੜ֬ͷରΛ࠷େʹ͢Δ ΛٻΊΔ͜ͱͰ ͋Δͱ͍͑Δɽ
MAPਪఆ ͱ͢Δͱੜ֬ ͱͳΓ࠷దԽҎԼ ͷΑ͏ʹ͔͚Δ աֶशΛ͙ͨΊͷਖ਼ଇԽ߲ͱͯ͠ػೳ͍ͯ͠ΔͨΊ, ࠷ਪ ఆΑΓ൚Խੑೳ͕ߴֶ͍श͕ظͰ͖Δɽ ͜ΕΛࣄޙ֬࠷େ(Maxmux a Posteriori,
MAP)ਪఆͱݺͿɽ
ࣄޙ֬ ࣄޙ֬ϕΠζͷఆཧʹΑͬͯҎԼͷΑ͏ʹٻΊΒΕΔɽ MAPਪఆ͜ͷࣄޙ͕֬࠷େͱͳΔ ΛٻΊΔͱͳΔ
ϕΠζਪఆ ࠷ਪఆMAPਪఆύϥϝʔλͷΛਪఆ͢ΔͨΊਪఆͱݺΕΔ ਪఆ͞ΕͨύϥϝʔλʹΑͬͯ৽ͨͳσʔλ ͷ༧ଌ ΛٻΊΔ͜ͱ ͕Ͱ͖Δ ͦΕʹ͍ͨͯ͠ύϥϝʔλͷࣄޙ͔֬ΒॏΈ͚͞Εͨ༧ଌΛٻΊΔํ ๏ΛϕΠζਪఆͱݺͿ ͭ·Γύϥϝʔλࣗମ֬ͱͯ͠දݱ͢Δɽ ͜ͷΑ͏ͳੵܭࢉղੳతʹٻΊΔ͜ͱ͕େͰ͖ͳ͍ͨΊɼ͜ͷۙࣅղΛͲΑ
͏ʹٻΊΔ͔ͱ͍͏ΞϧΰϦζϜ͕ଘࡏ͢Δ
LDAʹ͓͚ΔఆࣜԽ • ؍ଌσʔλ: • ֤σʔλͷજࡏม: • જࡏมͷऔΓ͏Δ: • જࡏมͷऔΓ͏Δͷ֬ม: •
֤જࡏม֬ϕΫτϧ ʹجͮ͘ଟ߲ʹै͏ • \piσΟϦΫΤʹΑͬͯੜ͞ΕΔ
LDAʹ͓͚ΔఆࣜԽ • ͱ ϋΠύʔύϥϝʔλ • ͱɹ ಉ͡
LDAʹ͓͚ΔϕΠζਪఆ ҎԼͷ༧ଌΛٻΊΔͷ͕తͰ͋Δ
3.2 αϯϓϦϯάۙࣅ๏ • αϯϓϦϯάۙࣅ๏ ࣄޙ͔ΒαϯϓϦϯά͞Εͨෳͷύϥϝʔλͷฏۉʹਲ ͬͯ༧ଌΛߦ͏ • ΪϒεαϯϓϦϯά • पลԽΪϒεαϯϓϦϯά
αϯϓϦϯά͔Βͷۙࣅܭࢉ ͱͯ͠ࣄޙ͔ΒͷαϯϓϧΛSݸੜ͢Δͱɼ ͱͯۙ͠ࣅܭࢉΛߦ͏͜ͱ͕Ͱ͖Δɽ ࣄޙ͔Βͷαϯϓϧੜ͕Ͱ͖Εۙࣅܭࢉ͕ՄೳͰ͋Δ͕, αϯϓ ϧੜଟ͘ͷ߹ίετ͕ߴ͍ɽ ͜ͷΑ͏ͳ߹ʹଟ͘༻͍ΒΕΔͷ͕ΪϒεαϯϓϦϯάͰ͋Δ
ΪϒεαϯϓϦϯά ΪϒεαϯϓϦϯάͰతͷࣄޙ͔ΒͷαϯϓϧੜΛߦ͏ΘΓ ʹɼαϯϓϧͷܭࢉίετ͕͍͖݅֬Λߏ͠ɼ֬มΛ ަޓʹαϯϓϧੜ͢Δ͜ͱͰɼతͷࣄޙ͔ΒͷαϯϓϧΛੜ͢Δ LDAͰજࡏม ΛαϯϓϦϯάରͱ͢Δ͜ͱͰܭࢉίετͷ͍ ͖݅Λߏ͍ͯ͠Δɽ • ΪϒεαϯϓϦϯάͷྲྀΕ [ࣄޙ]
=> [݁߹] => [ϕΠζͷఆཧʹΑΓల։] => [ఆҼࢠΛ আ֎]
z_iͷαϯϓϦϯά ͔Β ΛऔΓআ͍ͨજࡏมू߹Λ ͱදه͢Δ Ҏ֎ͷͯ͢ͷ֬มΛطͱݻఆ͖ͯ݅֬͠ΛٻΊ Δ
• ʹؔͳ͍߲আڈͯ͠ߟ͑Δ • ݁߹֬ΛϕΠζͷఆཧͰల։͢Δ
(3.18)͔Β(3.19)ʹ͍ͭͯ • ʹ͍ͭͯల։ • ʹରͯ͠د༩͠ͳ͍ͷΛཧ -ɹ ʹ͍ͭͯల։
• ʹد༩͠ͳ͍ͷΛཧ • ʹ͍ͭͯల։
• د༩͠ͳ͍ͷΛཧ • ల։ͯ͠ ʹؔΘΔͷ, ʹؔΘΔͷ͚ͩʹ͢Δ • z_i=kʹؔΘΔͷ͚ͩʹ͢Δ
ਖ਼نԽ߲Λܭࢉ͢Δ • ࢠ͕ܭࢉͰ͖ͨͷͰɼͦΕʹ߹ΘͤͯΛઃఆ͍ͯ͠ Δɻ • z_iͷऔΓ͏ΔΛͯ͢ͱͬͯ૯Λͱ͍ͬͯΔͷͰଟཧ తʹ1ʹͳΔ
ͷ͖݅
3.2.2 पลԽΪϒεαϯϓϦϯά • Λੵফڈ͢Δ͜ͱͰ ΛαϯϓϦϯά͢Δ • ֬มͷੵআڈपลԽͱݺΕΔ͜ͱ͔ΒɼपลԽΪ ϒεαϯϓϦϯάͱݺͿ
ࣄޙͷల։
पลԽͷੵ
ੵܭࢉΛղੳతʹٻΊΔ पลԽΪϒεαϯϓϦϯάΛߦ͏ͨΊʹղੳతʹੵܭࢉ͕Ͱ͖ͳ ͚ΕͳΒͳ͍ ੵࣜࣄޙ֬ʹΑΔظܭࢉͱΈͳ͢͜ͱ͕Ͱ͖ɼ ܭࢉରͷ֬ͷڞࣄલΛ༻͍ͯࣄલΛߏ͢Δ͜ͱ ͰੵܭࢉΛղੳతʹٻΊΔ͜ͱ͕Ͱ͖Δɽ LDAͷ߹σΟϦΫϨͳͷͰ,ҎԼͷఆཧʹै͏
࠷ॳͷ͜Ζͷσʔλഁغ͢Δඞཁ͕͋Δ αϯϓϦϯάͰॳظͷࠒͷσʔλॳظʹґଘ͢ΔͷͰഁغ ͢Δඞཁ͕͋Δɽ ͜ͷظؒͷ͜ͱΛburn-in periodͱݺͿ